Jericho HTML Parser

ソフトウェアのスクリーンショット:
Jericho HTML Parser
ソフトウェアの詳細:
バージョン: 3.3
日付のアップロード: 20 Feb 15
開発者: Martin Jericho
ライセンス: 無料
人気: 3

Rating: nan/5 (Total Votes: 0)

Jerich HTMLパーサは完全にJavaで書かれたオープンソースの、シンプルでありながら強力なライブラリです。
これは、プログラマがHTMLドキュメントの一部を操作し、分析することができます。
Jerich HTMLパーサはまた、高レベルのHTMLフォーム操作機能を搭載します。

このリリースのの新機能:ます。

  • バグ修正:
  • [3581664] CharacterReference.decodeは、()の数字を含むエンティティをデコードしない - &frac12。 &frac14。 &frac34。 &SUP1。 &SUP2。 &SUP3。 ∴
  • [3311286] SourceCompactor TEXTAREAを尊重していません。
  • [3519131]レンダラー出力Elementオブジェクトで構成する際、誤っます。

  • 間違ったブロック境界上のフォント飾りの
  • [3538829]レンダラ出力します。

  • 引数は大文字が含まれている場合は
  • Segment.getAllStartTags(名前)とSegment.getFirstElement(名)が動作しません。
  • エスケープサーバータグ内の一般的なサーバタグの終了デリミタが誤ってエスケープタグの最後の区切り文字として認識されます。

  • 既存のプログラムの挙動に影響を与える可能性が
  • CHANGES:
  • [3427073] Segment.getStyleURISegments()になりましたスタイル要素の内容だけでなく、スタイル属性値が含まれます。
  • [3427927] Segment.getURIAttributes()は現在のオブジェクトとアプレット要素のアーカイブ属性が含まれます。
  • もはや完全なシーケンシャル解析中にスクリプト要素の中に認識さコメント。以前は、それらは主要なブラウザとの互換性のために認識されたが、現代のブラウザの動作が変更されています。
  • ERRORにINFOからすべての解析エラーのログレベルを変更し、INFOにWARNからSource.fullSequentialParse()勧告メッセージのログレベル。以前のレベルは、解析エラーを示しながら勧告メッセージを非表示にするから、ロギングシステムを防止し、勧告メッセージを構文解析エラーよりも高い重大度を与えた。文字エンコーディングの警告は、レベルをWARN変更されないままます。

  • 相対URLがレンダリングされないように、
  • Renderer.renderHyperlinkURL(StartTag)メソッドの動作を変更しました。

  • それは任意のHTTP無視して、ハイパーリンクのURLと同じである場合、そのハイパーリンク要素の内容がレンダリングされないように
  • レンダラの動作を変更://接頭辞または/接尾辞をします。
  • EndTag.tidy()は閉じ括弧の前に空白文字を削除します。
  • 追加ソース(ファイル)コンストラクタます。
  • を追加しましOutputDocument.getSegment()メソッドます。
  • を追加しましOutputDocument.remove方法を(int型、int型の終了を開始)します。
  • を追加しましRenderer.setHRLineLength()メソッドます。
  • を追加しましRenderToText.jsp Webアプリケーションのサンプルます。
  • を追加しましSegment.getRowColumnVector()メソッドます。
  • エンコーディング検出は現在、予備のエンコーディングと互換性のないコード単位のサイズを持っているメタタグに指定された共通のエンコーディングを無視します。
  • 次のロガーAPIへのアップグレード:SLF4J-API-1.7.2、log4jの-1.2.17ます。

のバージョン3.1のの新機能:

  • バグの修正:
  • Segment.getAllStartTagsの[2793556]無限ループ()
  • Segment.getAllElements上の無限ループ()
  • Segment.getFirst *メソッドは、境界セグメント外のセグメントを返さます。
  • Segment.getAllElements方法はいくつかの状況では、すべての囲まれている要素を返しませんでしたします。

  • Segment.getAllElements法における
  • 固定ドキュメントのエラーます。
  • を追加しましStreamedSourceクラスます。

  • 既存のプログラムの挙動に影響を与える可能性が
  • CHANGES:
  • はインターフェイスするクラスからParseTextを変更します。
  • Segment.getNodeIterator()は現在、独立したノードとして文字参照を返します。
  • は、属性値の正規表現に基づいたタグの検索方法が追加されました。
  • はHTMLクラス属性に基づいて、タグ検索方法を追加しました。
  • は、以前のバージョンのものにSegment.getNodeIterator()機能を復元するために一時的に静的Source.LegacyNodeIteratorCompatabilityModeプロパティが追加されました。
  • はParseTextのchar []ベースの検索方法を削除します。
  • を追加しましCharacterReference.appendCharTo(追加可)メソッドます。
  • を追加しましOutputDocument(セグメント)コンストラクタます。
  • を追加しましStreamedSourceCopyサンプルプログラムします。

のバージョン3.0のの新機能:

  • バグの修正:

  • ユニコード補助文字を表す
  • 文字参照は、UTF-16コード単位のペアに正しく復号されませんでした。

  • デマンドモードでの解析で呼び出された場合に
  • [2188446] Element.getDepth()とElement.getParentElement()が誤った結果を返します。
  • のコメントは今の内側&LT認識されている。スクリプト&GT。要素ます。

  • 下位互換性はありません。
  • APIの変更:
  • 変更されたパッケージ名がnet.htmlparser.jerichoする
  • は属性値は現在の文字列ではなくたCharSequenceにする必要があります。
  • は、以前のバージョンからのすべての非推奨のメソッド/クラスを削除します。
  • すべては、すべてのタグの検索方法で一貫した命名規則を適用するために、* getメソッドのために廃止*メソッドを見つけます。
  • タグ、エレメントとHTMLElementsクラスはもはやHTMLElementNameインターフェイスを実装していない。 (代わりに静的インポートを使用)します。
  • すべてのコレクションは今stonglyジェネリックを使用して入力したします。
  • は列挙にFormControlOutputStyleクラスを変更します。
  • は列挙にFormControlTypeクラスを変更します。
  • を追加しましCharStreamSource.appendTo(追加可)メソッドます。
  • を追加しましSource.iterator()メソッドます。
  • ソースは今のIterableを実装しています。
  • は内部的にパフォーマンスを向上させるためのStringBuilderを使用しています。
  • を追加しましSource.getNextStartTag(StartTagType)メソッドます。
  • を追加しましSource.getNextEndTag(EndTagType)メソッドます。
  • を追加しましSource.getPreviousStartTag(StartTagType)メソッドます。
  • を追加しましSource.getPreviousEndTag(EndTagType)メソッドます。
  • を追加しましSegment.getAllStartTags(StartTagType)メソッドます。
  • はすべてSegment.getFirst *メソッドを追加しました。
  • を追加しましRenderer.renderHyperlinkURL(StartTag)メソッドます。
  • を追加しましHTMLSanitiserサンプルプログラムします。

  • <李は> -API-1.5.6をSLF4Jにアップグレードさ

の要件

  • は、Java 2 Standard Editionのランタイム環境ます。

同じようなソフトウェア

mdxflavours
mdxflavours

14 Apr 15

Markdoc
Markdoc

11 May 15

svn2cl
svn2cl

17 Feb 15

lcov_cobertura
lcov_cobertura

20 Feb 15

開発者の他のソフトウェア Martin Jericho

へのコメント Jericho HTML Parser

コメントが見つかりません
コメントを追加
画像をオンにする!