Apacheの豚は、Apache Hadoopのプロジェクトから生み出され、それが処理され、保存されたデータを分析する方法を提供することを担当してWHEREそのモジュールの1つになっています。
豚は、学ぶことは非常に簡単で、両方のリレーショナルおよび機能的なスタイルをサポートしています "豚ラテン語」と呼ばれるカスタムクエリ言語を使用します。
これは、データの結合とフィルタ、またはあなたがそののMapReduce機能、データマッパーと減速を使用することができますから利益を得る古典的なSQL言語としてそれを使用できることを意味します。
デフォルトでは、Apacheの豚は、Hadoopのインストールの内部で使用されることを意図したが、新しいバージョンでは、それは別のJVMを経由して個別に実行することができます。
このリリースの新機能:
このプラグイン可能な実行エンジンを(豚は、将来的に非のMapReduceエンジン上で実行できるようにします)
自動ローカルモード(小さな入力データサイズのジョブには、インプロセスで実行するために)
(イサキのインタラクティブ性を改善するために)最適化を取得します
ローカルモードの固定カウンタ
ユーザーレベルのjarキャッシュのサポート
豚のコマンドをブラックリストとホワイトリストのサポート
いくつかのパフォーマンスの修正とデバッグ可能性の機能
いくつかの非後方互換のインターフェースの変更は、非のMapReduceエンジンを搭載した豚を動作させるために、このリリースで導入されました
このバージョン0.14.0の新機能です:
このプラグイン可能な実行エンジン(豚は、将来的に非のMapReduceエンジン上で実行できるようにします)
自動ローカルモード(小さな入力データサイズのジョブには、インプロセスで実行するために)
(イサキのインタラクティブ性を改善するために)最適化を取得します
ローカルモードの固定カウンタ
ユーザーレベルのjarキャッシュのサポート
豚のコマンドをブラックリストとホワイトリストのサポート
いくつかのパフォーマンスの修正とデバッグ可能性の機能
いくつかの非後方互換のインターフェースの変更は、非のMapReduceエンジンを搭載した豚を動作させるために、このリリースで導入されました
このバージョン0.11.0の新機能です。
このリリースはDATETYPEデータ型、RANK、CUBEとROLLUP演算子、GroovyのUDFの、カスタム減速推定、スキーマベースのタプルとHCatalog DDLを含み統合。
このバージョン0.9.1の新機能は次のとおりです。
このリリースはHadoopの0.20で動作します。
このバージョン0.6の新機能です:
この追加ゼブラのcontribプロジェクトとして。 http://wiki.apache.org/pig/zebraを参照してください。
追加UDFContextは、UDFのに終わりを前から後ろに情報を渡す方法を提供し、バックエンドでJobConfにUDFSのアクセスを提供します。
追加された左外部結合フラグメントの複製のために参加します。
豚ラテン語からのジョブの優先順位を設定する機能を追加しました。
で動作するように強化されたマルチクエリは、いくつかのケースで結合します。
大幅ヒープ障害のGCのオーバーヘッドとアウトを減らすためにメモリマネージャを作り直しました。
UDFのアキュムレータインタフェースが追加されました。
100以上のバグの修正と改良。
この要件:
こののJava 1.6.xの以上
ApacheのHadoopの0.20.x以上
コメントが見つかりません