アーチは、イントラネット検索のためのApache Nutchは(人気のある、非常にスケーラブルな汎用検索エンジン)のオープンソースの拡張機能です。あなたの企業の検索エンジンには満足しませんか?驚くべきことではない、非常に少数の人々があります。我々の知る限り、同様にGoogleのグローバルWeb検索を行うように動作しないイントラネットエンジンはありません。このための根本的な理由があります:グローバルWeb(または類似)でGoogleによって使用されるアルゴリズムは、統計データの不足のためにイントラネット上でほぼ同様に動作しません。アーチは、(ついに!)この問題を解決します。それは素晴らしい作品高精度な検索結果を提供する新規な方法を使用しています。それを信じてはいけませんか?ブラインドテスト評価ツールが含まれています。あなたはアーチを展開し、ブラインドテストの方法論を使用して、現在の検索エンジンおよび/または(あなたのサイトの公開部分に)Googleにその性能を比較することができます。
優れた検索品質に加えて、アーチは、企業環境のための重要な多くの機能を備えています。
- ドキュメントレベルのセキュリティ。ユーザーは、参照を許可されているドキュメントのみを検索することができます。
- 安価なインデックス更新。アーチは、最新のインデックスを維持し、定期的に完全なサイト再クロールを回避することが可能です。
- 24/7在庫状況。利用可能な作業指数は、クロールが失敗した場合でも、常にあります。- 必要に応じて、個別に任意のサイトを検索し、管理する能力を持つ複数のWebサイトの同時インデックス作成と検索をサポート。動的な追加およびウェブサイトの除去が容易です。
- 自動的に生成されたサイトディレクトリ。
- 低コストのサポートが一度に展開します。
- 簡単な展開とカスタマイズのためのデュアルインターフェイス(PHPとJava)。
- 「箱から出して「ファセット検索。
- さまざまなファイル形式を解析するためのパーサの広範かつ拡張セット:HTML、PHP、PDF、MSオフィス、オープンオフィスなど
- 簡単にカスタマイズおよび拡張できるモジュール、プラグインベースのアーキテクチャ。
- ソースコードが含まれています。
- 高パフォーマンスとスケーラビリティ。アーチは、インデックス、非常に大規模なデータセットへのコンピュータ・クラスタ上で実行することができます。
このリリースの新機能:ます。
バージョン1.9.2:改良された文書の解析、Nutchは1.9に移植されます。
バージョン1.7の新機能です:
このNutchは1.7に移植された追加されたセキュリティスキャン、
この要件:ます。
のJava 1.7、Cygwinの
コメントが見つかりません