はApache Mahoutのは、Java開発者はスケーリング機械学習アルゴリズムを記述するために作成されました。
Mahoutのは、すべてのオープンソースライセンスの下で、商用グレードの結果で、ビジネスレベルのコードと一緒に、膨大なデータの負荷を処理することを意図されます。
次のように
現在Mahoutのプロセスである:それを取得する鉱山データを、データを整理し、それを学ぶためにそれを分類するために、それをクラスタ化
このリリースの新機能:
このリリースでは、ドライバーの火花itemsimilarityの象使い-1707で使用される共起分析の主要なメモリ使用量のバグが修正されています。これは現在、エグゼキュータがはるかに少ないメモリを必要とします。
サポートスパーク1.2.2以下 - によるスパークのバグ1.2+ JavaSerializer(SPARK-6069)で、我々は、Sparkエグゼキュータで実行される任意のコードからグァバの使用を削除しました。これを行うために、私たちはとても古いグアバのコレクションを使用する方法を示す任意のコード例では、廃止されました2領域マップベースのScalaのコレクションを作成しました。
Mahoutの-サムサラQR分解と行列OPSにいくつかのマイナーな修正。
#のx3cを、&するために、パッケージサイズをスリム化。 200メガバイト - 象使い-1704。
マイナーテストは実行されませんMahoutのシェルを除いて、スパーク1.3とのバイナリ互換性を示しています。
このバージョン0.10.1の新機能です。
このリリースでは、ドライバーの火花itemsimilarityの象使い-1707で使用される共起分析の主要なメモリ使用量のバグが修正されています。これは現在、エグゼキュータがはるかに少ないメモリを必要とします。
サポートスパーク1.2.2以下 - によるスパークのバグ1.2+ JavaSerializer(SPARK-6069)で、我々は、Sparkエグゼキュータで実行される任意のコードからグァバの使用を削除しました。これを行うために、私たちはとても古いグアバのコレクションを使用する方法を示す任意のコード例では、廃止されました2領域マップベースのScalaのコレクションを作成しました。
Mahoutの-サムサラQR分解と行列OPSにいくつかのマイナーな修正。
#のx3cを、&するために、パッケージサイズをスリム化。 200メガバイト - 象使い-1704。
マイナーテストは実行されませんMahoutのシェルを除いて、スパーク1.3とのバイナリ互換性を示しています。
このバージョン0.10.0の新機能です:
このMahoutの数学線形代数のためのScala DSLバインディング。
検索として推薦。
簡単な機能マトリックスビューおよび誘導体のサポート
ClusterDumperのためのJSON出力フォーマット
キャロットRandomizedRunnerを使用して、すべてのMahoutのモジュールのための無作為化試験を有効にします。
1次元クラスタリングを使用して、正確な分位数を計算するためのオンラインアルゴリズム。
Luceneの4.6.1にMahoutのアップグレード
このバージョン0.8の新機能です:
このバイアスされたアイテムベース推薦のサポート
ユーザーとアイテムバイアスの評価予測のためのSGD行列因子
SVDのサポート++
一つ以上のLuceneストレージSequenceFilesへのインデックスと同様のLucene 4.3.1にサポートしているLuceneのバージョンのアップグレードを変換するためのサポート。
新しいストリーミングをオンラインで提供しています実装(および高速)kは、意味クラスタリング
SequenceFiles地図-削減への変換を行い、「seqdirectoryは「今のMapReduceジョブとして実行することができます。
(インデックスまたは値)をハッシュするベクトルの次元を指定MinHashDriverにオプションを追加しました。
行列の連結方式ユーティリティは、現在、2つだけの行列を連結します。
CommonsLang3にアップグレード
並行して実行テストを行うことで、Mahoutのビルドを高速化。
コメントが見つかりません