Apacheのハイブは、最初にデータのために、熟練したクエリ言語を使用して簡単にHadoopの管理者を提供するためのApache Hadoopのサブプロジェクトとして開発されました。
このため、ハイブは、各クエリのための情報の膨大な量で動作するように最初から開発された、完全に大規模なデータベースやビジネス環境に適合されています。
カスタムデータ構造は、データフォーマットの広いセットに強制することができながら、ツールは、簡単に、ロード抽出したデータを変換するために含まれています。
それはHadoopの関連プロジェクトなので、HDFSとHBaseのプロジェクトも自動的にサポートされています。
HiveQLまた、ネイティブSQL構文が所望のデータを得ることができない状況でマッパーと減速を扱うことができる一方、シンプルな革新的かつ効率的なクエリ言語を提供する、おそらくプロジェクトの最良の部分です。
このリリースで新しい何が:
このWHERE句での非相関サブクエリをサポート
行形式仕様として定義されたNULLを追加
Ccreate /ドロップデータベースは、入力/出力を移入し、同時実行性と、ユーザーの許可を確認する必要があります
ハイブ小数点型にスケールと精度を指定するサポート
TEZはそこにしてみましょう
配列内の項目の位置を含む爆発機能
char型のデータ型を追加します。
作成UDFを収集し、評価を再利用可能にします
統計情報を提供するために、レコードの作家やORCリーダ/ライタインタフェースを拡張
ORCの作家と読者のインタフェースを提供する統計を実装
メタストアからの統計でハイブ演算子ツリーに注釈を付けます
ORCでストライプレベル列の統計情報を提供します
サブクエリのサポート:サブクエリのネストを許可しません
サブクエリのサポート:having句のサブクエリの表現を可能にします
サブクエリのサポート:より多くのテスト
ハイブ内のネイティブ寄せ木サポート
ハイブは、テーブルのデータファイルを読み込む際にヘッダーとフッターの行をスキップすることができるはずです
DATE、TIMESTAMP、DECIMALを追加し、CHAR、VARCHARタイプは、HCatでサポート
中間結果をキャッシュするマップ・ジョインヒントを使用します
地理座標間の距離を計算するためにUDFを追加
このバージョン1.2.0の新機能です:
このWHERE句で非相関サブクエリをサポート
行形式仕様として定義されたNULLを追加
Ccreate /ドロップデータベースは、入力/出力を移入し、同時実行性と、ユーザーの許可を確認する必要があります
ハイブ小数点型にスケールと精度を指定するサポート
TEZはそこにしてみましょう
配列内の項目の位置を含む爆発機能
char型のデータ型を追加します。
作成UDFを収集し、評価を再利用可能にします
統計情報を提供するために、レコードの作家やORCリーダ/ライタインタフェースを拡張
ORCの作家と読者のインタフェースを提供する統計を実装
メタストアからの統計でハイブ演算子ツリーに注釈を付けます
ORCでストライプレベル列の統計情報を提供します
サブクエリのサポート:サブクエリのネストを許可しません
サブクエリのサポート:having句のサブクエリの表現を可能にします
サブクエリのサポート:より多くのテスト
ハイブ内のネイティブ寄せ木サポート
ハイブは、テーブルのデータファイルを読み込む際にヘッダーとフッターの行をスキップすることができるはずです
DATE、TIMESTAMP、DECIMALを追加し、CHAR、VARCHARタイプは、HCatでサポート
中間結果をキャッシュするマップ・ジョインヒントを使用します
地理座標間の距離を計算するためにUDFを追加
このバージョン1.1.0の新機能です:
このWHERE句で非相関サブクエリをサポート
行形式仕様として定義されたNULLを追加
Ccreate /ドロップデータベースは、入力/出力を移入し、同時実行性と、ユーザーの許可を確認する必要があります
ハイブ小数点型にスケールと精度を指定するサポート
TEZはそこにしてみましょう
配列内の項目の位置を含む爆発機能
char型のデータ型を追加します。
作成UDFを収集し、評価を再利用可能にします
統計情報を提供するために、レコードの作家やORCリーダ/ライタインタフェースを拡張
ORCの作家と読者のインタフェースを提供する統計を実装
メタストアからの統計でハイブ演算子ツリーに注釈を付けます
ORCでストライプレベル列の統計情報を提供します
サブクエリのサポート:サブクエリのネストを許可しません
サブクエリのサポート:having句のサブクエリの表現を可能にします
サブクエリのサポート:より多くのテスト
ハイブ内のネイティブ寄せ木サポート
ハイブは、テーブルのデータファイルを読み込む際にヘッダーとフッターの行をスキップすることができるはずです
DATE、TIMESTAMP、DECIMALを追加し、CHAR、VARCHARタイプは、HCatでサポート
中間結果をキャッシュするマップ・ジョインヒントを使用します
地理座標間の距離を計算するためにUDFを追加
このバージョン1.0.0の新機能です:
このWHERE句で非相関サブクエリをサポート
行形式仕様として定義されたNULLを追加
Ccreate /ドロップデータベースは、入力/出力を移入し、同時実行性と、ユーザーの許可を確認する必要があります
ハイブ小数点型にスケールと精度を指定するサポート
TEZはそこにしてみましょう
配列内の項目の位置を含む爆発機能
char型のデータ型を追加します。
作成UDFを収集し、評価を再利用可能にします
統計情報を提供するために、レコードの作家やORCリーダ/ライタインタフェースを拡張
ORCの作家と読者のインタフェースを提供する統計を実装
メタストアからの統計でハイブ演算子ツリーに注釈を付けます
ORCでストライプレベル列の統計情報を提供します
サブクエリのサポート:サブクエリのネストを許可しません
サブクエリのサポート:having句のサブクエリの表現を可能にします
サブクエリのサポート:より多くのテスト
ハイブ内のネイティブ寄せ木サポート
ハイブは、テーブルのデータファイルを読み込む際にヘッダーとフッターの行をスキップすることができるはずです
DATE、TIMESTAMP、DECIMALを追加し、CHAR、VARCHARタイプは、HCatでサポート
中間結果をキャッシュするマップ・ジョインヒントを使用します
地理座標間の距離を計算するためにUDFを追加
このバージョン0.8.1の新機能:簡単なデータ抽出/変換/ロード(ETL)を有効にする
このツール。
メカニズムは、データ形式の様々な構造を課します。
ファイルへのアクセスは、直接アパッチHDFS(TM)またはApacheなどのHBase(TM)などの他のデータ・ストレージ・システムのいずれかに格納されています。
MapReduceの経由クエリ実行。
このバージョン0.8.0の新機能です:
このツール簡単にデータ抽出/変換/ロード(ETL)を有効にします
メカニズムは、データ形式の様々な構造を課します
直接アパッチHDFS(TM)、または例えば、ApacheのHBaseのような他のデータ記憶装置に格納されたファイルへのアクセス(TM)
MapReduceの経由クエリ実行
このバグ:p>
このバージョン0.7.1の新機能です。
Windows上の例外JDBCドライバを使用。 "のIOException:指定されたパスが見つかりません]です。
彼らはDataNucleusに固有のテーブルを残すため、スキーマ作成スクリプトが不完全です。
改善点:
その他のエラーメッセージを改善します。
JDBCハイブドライバの正しいメジャー/マイナーバージョン番号を返します。
現在HIVEサポートされているデータ型に基づいてHivePreparedStatementの実装を追加します。
タスク:
Mavenのでハイブ。
メタストアはPostgreSQLのスクリプトとデフォルト・スキーマをアップグレードしてください。
このバージョン0.7.0の新機能です:
この新機能:
ハイブの認可インフラストラクチャ
ハイブにインデックスを実装
Javaメソッドの呼び出しに反射)(UDFを反映追加
ハイブのTypeInfo / ObjectInspector(構造体、配列、およびマップのほかに)組合をサポートします
GenericUDF str_to_mapを実装
ハイブにHAVING句サポートするためのパッチ
自動的にマップ・ジョインに変換されている加入トラック
JMX経由HiveMetaStoreためのコール頻度と期間のメトリック
メタストアでlastAccessTimeを維持
改善:
ヘッダをエクスポートするオプションを提供します
二つ以上の列に明確な選択のためのサポート
拡張テーブル/パーティション出力が不可解で説明
列名に基づいてのgetTables、のgetColumnsとHiveResultSet.get *メソッドのようないくつかのJDBC機能がありません。
子プロセスからログをタップします
非ネイティブのテーブルに対してサポートフィルタプッシュダウン
HBaseの推奨されないAPIの依存関係を交換
ロック中QUERYIDを追加
指定されていない場合にのみ、transident_lastDdlTimeを更新
ハイブのロックのためのより多くのデバッグ情報を追加します。
HiveInputFormatまたはCombineHiveInputFormatは常に二回のrcfileのブロックを同期
ローカルタスクにかかる時間を表示
新しいZooKeeperのインスタンスを作成したときに再試行ロック、およびデバッグのためのより多くの情報
非ローカルモードでマップ参加の可能性を確認するために、タスクを実行するオプションを追加
ロックのためのより多くのデバッグ
0パーティションが作成されている場合はエラーをスローするように動的パーティション挿入でオプションを追加
バグ:
" LOAD DATA LOCALのINPATH"テーブルが既に同じ名前のファイルが含まれている場合に失敗します
NULLが参加する中で正しく処理されません
HiveInputFormat.getInputFormatFromCache"ツバメ" IOExcpetionを投げたときに例外が発生
参加し、GROUPBYの進展を追加
空行の問合せの1以上のパラメータがクラッシュした単純なUDAFs
UDFフィールド()が動作しません。
ダイナミックパーティションインサートは、Hadoopの0.17ローカルモードで汚れた空のファイルを残しました
RunningJob.getCounters()がnullを返したときにカウンタ更新をスキップ
このバージョン0.5.0の新機能です:
このユーザーがカスタムスクリプトのserdeを指定してみましょう。
UDFのUNHEXを追加します。
FileSinkOperatorからlzocodecインポートを削除します。
ドライバNullPointerExceptionが最初にコンパイルすることなく、getResultsを呼び出すとき。
ハイブ内のrcfileとColumnarSerDeのためのパフォーマンスの向上。
コメントが見つかりません