Jerich HTMLパーサは完全にJavaで書かれたオープンソースの、シンプルでありながら強力なライブラリです。
これは、プログラマがHTMLドキュメントの一部を操作し、分析することができます。
Jerich HTMLパーサはまた、高レベルのHTMLフォーム操作機能を搭載します。
のこのリリースのの新機能:ます。
- バグ修正:
- [3581664] CharacterReference.decodeは、()の数字を含むエンティティをデコードしない - &frac12。 &frac14。 &frac34。 &SUP1。 &SUP2。 &SUP3。 ∴
- [3311286] SourceCompactor TEXTAREAを尊重していません。
- [3519131]レンダラー出力Elementオブジェクトで構成する際、誤っます。
- [3538829]レンダラ出力します。
- Segment.getAllStartTags(名前)とSegment.getFirstElement(名)が動作しません。
- エスケープサーバータグ内の一般的なサーバタグの終了デリミタが誤ってエスケープタグの最後の区切り文字として認識されます。
- CHANGES:
- [3427073] Segment.getStyleURISegments()になりましたスタイル要素の内容だけでなく、スタイル属性値が含まれます。
- [3427927] Segment.getURIAttributes()は現在のオブジェクトとアプレット要素のアーカイブ属性が含まれます。
- もはや完全なシーケンシャル解析中にスクリプト要素の中に認識さコメント。以前は、それらは主要なブラウザとの互換性のために認識されたが、現代のブラウザの動作が変更されています。
- ERRORにINFOからすべての解析エラーのログレベルを変更し、INFOにWARNからSource.fullSequentialParse()勧告メッセージのログレベル。以前のレベルは、解析エラーを示しながら勧告メッセージを非表示にするから、ロギングシステムを防止し、勧告メッセージを構文解析エラーよりも高い重大度を与えた。文字エンコーディングの警告は、レベルをWARN変更されないままます。
- Renderer.renderHyperlinkURL(StartTag)メソッドの動作を変更しました。
- レンダラの動作を変更://接頭辞または/接尾辞をします。
- EndTag.tidy()は閉じ括弧の前に空白文字を削除します。
- 追加ソース(ファイル)コンストラクタます。
- を追加しましOutputDocument.getSegment()メソッドます。
- を追加しましOutputDocument.remove方法を(int型、int型の終了を開始)します。
- を追加しましRenderer.setHRLineLength()メソッドます。
- を追加しましRenderToText.jsp Webアプリケーションのサンプルます。
- を追加しましSegment.getRowColumnVector()メソッドます。
- エンコーディング検出は現在、予備のエンコーディングと互換性のないコード単位のサイズを持っているメタタグに指定された共通のエンコーディングを無視します。
- 次のロガーAPIへのアップグレード:SLF4J-API-1.7.2、log4jの-1.2.17ます。
間違ったブロック境界上のフォント飾りの
引数は大文字が含まれている場合は
既存のプログラムの挙動に影響を与える可能性が
相対URLがレンダリングされないように、
それは任意のHTTP無視して、ハイパーリンクのURLと同じである場合、そのハイパーリンク要素の内容がレンダリングされないように
のバージョン3.1のの新機能:
- バグの修正:
- Segment.getAllStartTagsの[2793556]無限ループ()
- Segment.getAllElements上の無限ループ()
- Segment.getFirst *メソッドは、境界セグメント外のセグメントを返さます。
- Segment.getAllElements方法はいくつかの状況では、すべての囲まれている要素を返しませんでしたします。
- 固定ドキュメントのエラーます。
- を追加しましStreamedSourceクラスます。
- CHANGES:
- はインターフェイスするクラスからParseTextを変更します。
- Segment.getNodeIterator()は現在、独立したノードとして文字参照を返します。
- は、属性値の正規表現に基づいたタグの検索方法が追加されました。
- はHTMLクラス属性に基づいて、タグ検索方法を追加しました。
- は、以前のバージョンのものにSegment.getNodeIterator()機能を復元するために一時的に静的Source.LegacyNodeIteratorCompatabilityModeプロパティが追加されました。
- はParseTextのchar []ベースの検索方法を削除します。
- を追加しましCharacterReference.appendCharTo(追加可)メソッドます。
- を追加しましOutputDocument(セグメント)コンストラクタます。
- を追加しましStreamedSourceCopyサンプルプログラムします。
Segment.getAllElements法における
既存のプログラムの挙動に影響を与える可能性が
のバージョン3.0のの新機能:
- バグの修正:
- 文字参照は、UTF-16コード単位のペアに正しく復号されませんでした。
- [2188446] Element.getDepth()とElement.getParentElement()が誤った結果を返します。
- のコメントは今の内側&LT認識されている。スクリプト&GT。要素ます。
- APIの変更:
- 変更されたパッケージ名がnet.htmlparser.jerichoする
- は属性値は現在の文字列ではなくたCharSequenceにする必要があります。
- は、以前のバージョンからのすべての非推奨のメソッド/クラスを削除します。
- すべては、すべてのタグの検索方法で一貫した命名規則を適用するために、* getメソッドのために廃止*メソッドを見つけます。
- タグ、エレメントとHTMLElementsクラスはもはやHTMLElementNameインターフェイスを実装していない。 (代わりに静的インポートを使用)します。
- すべてのコレクションは今stonglyジェネリックを使用して入力したします。
- は列挙にFormControlOutputStyleクラスを変更します。
- は列挙にFormControlTypeクラスを変更します。
- を追加しましCharStreamSource.appendTo(追加可)メソッドます。
- を追加しましSource.iterator()メソッドます。
- ソースは今のIterableを実装しています。
- は内部的にパフォーマンスを向上させるためのStringBuilderを使用しています。
- を追加しましSource.getNextStartTag(StartTagType)メソッドます。
- を追加しましSource.getNextEndTag(EndTagType)メソッドます。
- を追加しましSource.getPreviousStartTag(StartTagType)メソッドます。
- を追加しましSource.getPreviousEndTag(EndTagType)メソッドます。
- を追加しましSegment.getAllStartTags(StartTagType)メソッドます。
- はすべてSegment.getFirst *メソッドを追加しました。
- を追加しましRenderer.renderHyperlinkURL(StartTag)メソッドます。
- を追加しましHTMLSanitiserサンプルプログラムします。
ユニコード補助文字を表す
デマンドモードでの解析で呼び出された場合に
下位互換性はありません。
<李は> -API-1.5.6をSLF4Jにアップグレードさ
の要件の
- は、Java 2 Standard Editionのランタイム環境ます。
コメントが見つかりません