PHPCrawl

ソフトウェアのスクリーンショット:
PHPCrawl
ソフトウェアの詳細:
バージョン: 0.83
日付のアップロード: 1 Mar 15
開発者: Uwe Hunfeld
ライセンス: 無料
人気: 26

Rating: nan/5 (Total Votes: 0)

サーチ·クローラー(スパイダー)は、さまざまな情報については、その鉱山のWebページを書面で使用することができます。
PHPCrawlは、それがフェッチするように設定された情報を取得し、さらに処理するために、より強力なアプリケーションに渡します。

の特長の:ます。

  • フィルタ用URLおよびContent-Typeのデータ
  • クッキーを処理する方法を定義します。
  • のrobots.txtファイルを処理する方法を定義します。
  • はさまざまな方法でその活性を制限します。
  • マルチ処理モードます。

このリリースのの新機能:

  • 修正されたバグ:
    部分的にURLエンコードされており、部分的に再構築/正しくエンコードされませ
  • リンクします。

  • PHPCrawlerRobotsTxtParser.class.phpから
  • を削除不要なデバッグのvar_dump()
  • TLS / SSLでのサーバー名表示が正しく動作するようになりました。

  • <李は>&QUOT、ベースHREF&QUOT、ウェブサイトで - タグを再度正しく解釈を取得します。。
    コー​​ドは完全にPHP5-OO-に移植され、リファクタリングされました。

    のバージョン0.80ベータ版のの新機能であるコー​​ドとコードの多くが書き直されました。

  • はウェブサイトをスパイダーするために使用する複数のプロセスを使用する機能を追加しました。メソッド&QUOT、goMultiProcessed()&QUOT。追加します。
  • 新規オーバーライド可能なメソッド&QUOT、initChildProcess()&QUOT。マルチプロセスモードでクローラを使用する場合は、子プロセスを開始するために追加します。
  • の代替、非常に大規模なウェブサイトをスパイダーすることが可能となるURLの内部のSQLiteキャッシング·メカニズムをImplementetます。
  • メソッド&QUOT、setUrlCacheType()&QUOT。追加します。
  • 新しいメソッドsetWorkingDirectory()を手動でクローラ一時作業ディレクトリの場所を定義するために追加しました。その方法&QUOT、setTmpFile()&QUOT。非推奨とマーク(もはや機能はありません)されます。
  • Newメソッド&QUOT、addContentTypeReceiveRule()&QUOT。古い方法&QUOTを置き換え、addReceiveContentType()&QUOT;ます。
  • 機能&QUOT、addReceiveContentType()&QUOT。まだ存在していますが、非推奨としてマークされていたします。

の要件

  • PHP 5以上します。
  • OpenSSLサポートを有効にしてPHPます。

同じようなソフトウェア

PHP Search Engine
PHP Search Engine

13 May 15

Mr. Bigglesworth
Mr. Bigglesworth

13 May 15

Tipue Search
Tipue Search

12 May 15

Reds
Reds

1 Mar 15

へのコメント PHPCrawl

コメントが見つかりません
コメントを追加
画像をオンにする!