lxml

ソフトウェアのスクリーンショット:
lxml
ソフトウェアの詳細:
バージョン: 3.4.4 更新
日付のアップロード: 12 May 15
開発者: infrae.com
ライセンス: 無料
人気: 70

Rating: nan/5 (Total Votes: 0)

lxmlのは、Python言語のシンプルさと、これらのライブラリのスピードを兼ね備えています。
2.4から3.2までのすべてのCPythonのバージョンとの互換性

このこのリリースの新機能です:

このlxml.html.iterlinksは今のメタリフレッシュタグ内のリンクを返します。
新しいのXMLParserオプションcollect_ids = IDハッシュテーブルの作成を無効にする場合はFalse。これは、実質的に使用されていない多くの異なるIDを使用してドキュメントの解析をスピードアップすることができます。
パーサーは、XML IDのドキュメントごとのハッシュテーブルを使用しています。これは、グローバルパーサ辞書の負荷を軽減し、多くの異なるIDを持つ文書の解析スピードアップします。
ElementTree.getelementpath(要素)は、後で参照するために使用することができる指定された要素のための構造ElementPath式を返します。
XMLFILE()は、ファイルをクローズ真=近い新しい引数(様)は、それらへの書き込み後、オブジェクトを受け入れます。それは内部的にそれを開いていた場合の前に、XMLFILE()は、ファイルを閉じました。
許可"のByteArray" ASCIIテキスト入力のために入力します。

このバージョン3.4.2の新機能です:

このlxml.html.iterlinksは現在、メタリフレッシュタグ内のリンクを返します。
新しいのXMLParserオプションcollect_ids = IDハッシュテーブルの作成を無効にする場合はFalse。これは、実質的に使用されていない多くの異なるIDを使用してドキュメントの解析をスピードアップすることができます。
パーサーは、XML IDのドキュメントごとのハッシュテーブルを使用しています。これは、グローバルパーサ辞書の負荷を軽減し、多くの異なるIDを持つ文書の解析スピードアップします。
ElementTree.getelementpath(要素)は、後で参照するために使用することができる指定された要素のための構造ElementPath式を返します。
XMLFILE()は、ファイルをクローズ真=近い新しい引数(様)は、それらへの書き込み後、オブジェクトを受け入れます。それは内部的にそれを開いていた場合の前に、XMLFILE()は、ファイルを閉じました。
許可"のByteArray" ASCIIテキスト入力のために入力します。

このバージョン3.3.2の新機能:

このプロパティのリゾルバとバージョン、ならびに方法set_element_class_lookup()とMAKEELEMENT()、iterparseオブジェクトから失われました。
XMLスキーマ、SchematronのとのRelaxNGのインスタンスは、検証を実行する前に、地元のerror_logをクリアしていませんでした。
lxml.doctestcompareが混ざっ"予想"と"実際"属性値で。

このバージョン3.3.1の新機能です:

このバグは修正:
parser.feedで解析HTMLドキュメントは、()タグの反復中に要素を見つけることができませんでした。
PyPyにある建物は、PyPyのC-APIに欠落が原因PyUnicode_Compareのサポート()とPyByteArray _ *()に失敗しました。
stdint.h" MSVCでコンパイルが原因で行方不明&QUOTに失敗しました。標準のヘッダファイル。
iterparse()は、BOMプレフィックスファイルの解析に失敗しました。

このバージョン3.3.0の新機能です:

このバグは修正:
のURLからファイルパスを区別するヒューリスティックが少ない偽陰性を生成するために締めました。
3.2.2で失われたのPython 2.4用の<​​/ p>

この固定された支持ます。

バージョン3.2.3の新機能です。

このバージョン3.2.1の新機能です:

このメソッドのapply_templates()とprocess_children()XSLT拡張要素のelements_only二つの新しいブール型のオプションを獲得しており、remove_blank_textすべての文字列のいずれかを捨てること結果リストから、または空白のみの文字列。

このバージョン3.2.0の新機能:

このlxml.html内の文字列解析関数の動作を変更することができる空白をリードします。
lxml.htmlの文字列解析関数は、フレームセットまたは欠落bodyタグのような珍しいHTMLコンテンツの面でより堅牢です。
I / Oエラーが非ASCII文字を含むパスを使用してファイルにアクセスしようとすると、UnicodeDecodeErrorを上げる代わりに、適切にはIOErrorを報告する可能性がありながら。
メモリー内の文字列からデフォルトのパーサで無効なネットワークアクセスを解析し、失敗したURLから解析する後続の試行を行いました。

このバージョン3.1.2の新機能です:

この受渡しはサックスブリッジ(すなわちhandler.startElement()メソッド)の名前空間を認識しないAPIを介して属性TypeError例外で失敗しました。
Unicode文字列に結果ツリーに変換するときに、XSLT出力に直列化エラーを修正しました。

このバージョン3.0.2の新機能です:

このクラッシュを修正インタプリタのシャットダウン時に建物のためCython 0.17.3に切り替えること。

このバージョン3.0の新機能です:

このC14Nは、排他的な直列化の際に最上位レベルに昇格する包括的接頭辞を指定することができます。
(cpyextを通じて)PyPyに構築するための初期サポート。
DTDオブジェクトは、それらの宣言への読み取りアクセスを可能にするAPIを獲得しました。
xpathgrep.py(例えば、grepの出力から)ライン·バイ·ラインを解析するための支持を得て、新しいルート·タグを使用して出力を囲みます。
lxml.builderにおけるE-工場彼らの周りの要素を構築する場合(例えば、文字列のサブタイプなど)既知のデータ·タイプのサブタイプを受け入れます。
選択タグ引数を指定して、ツリーの反復とiterparseは()タグのセットを渡すことをサポートしています。彼らはタグのいずれかに一致する場合、ツリーノードが反復子によって返されます。

このバージョン2.3.5の新機能です:

このクラッシュelement.removeでテキストノードをマージ()。
サックス/ターゲット·パーサーでクラッシュ空のDOCTYPEを報告します。

このバージョン2.3.4の新機能です:

このクラッシュ空の名前空間URIとnsMapに(要素プロパティ)を構築。
原因競合状態にクラッシュエラー(またはユーザー·メッセージ)は、ねじXSLT処理中に発生します。
XSLTスタイルシートのコンパイルは、コンパイルエラーを無視することができます。

このバージョン2.3.3の新機能:

この機能が追加されました:
()は、新しいシリアル化オプションwith_tailとDOCTYPEを得たlxml.html.tostring。
バグ修正:
HTML解析用iterparse()を使用し、開始イベントを要求するときにクラッシュする問題を修正しました。
cssselectでよりセレクタの固定解析。それは子孫コンビネータあるとして擬似要素と擬似クラスの前に空白が重要です。 &QUOT; E:疑似&QUOT;疑似&QUOT ;,ない&QUOT; E:E *;&QUOTと同じように解析する必要があり、擬似]です。
「SRC」属性を持たない「IMG」タグを打つときlxml.html.diffもはや例外を生成しません。

このバージョン2.3.2の新機能:

この機能が追加されました:
lxml.objectify.deannotate()は、型注釈を除去した後に客観名前空間宣言を削除(および一般的に名前空間宣言をクリーンアップ)するために、新しいboolean型オプションcleanup_namespacesを持っています。
lxml.objectifyは、ユーザ側のlxml.etreeのそれ以外の冗長インポートを回避するためにetree.SubElementのコピーとして独自のサブ要素()関数を得ました。
バグ修正:
子孫&QUOT;&QUOTを修正しました。 cssselectのバグ(lxmlの2.3.1の最初の修正後)二回目。前回の変更は、変換式のXPathの基づく評​​価に重大なパフォーマンスの低下をもたらしました。これは以前に2.3.1で働いていたXSLTのロケーションパスとして生成されたXPath式のいくつかの使用法を破ることに注意してください。
cssselectの一部のセレクタの固定解析。コンビネータ&QUOT後の空白;&#のSpark Proの;&QUOT ;,&QUOT; +&QUOT;と&QUOT;〜&QUOT;正しく無視されます。以前子孫コンビネータとして解析されたされています。例えば、&QUOT; DIV&#Spark Proの。 .fooという&QUOT; DIV&#のSpark Proの; * .fooという&QUOT&QUOTと同じ解析されました。 DIV&#Spark Proの;代わりに&QUOTの.fooという]です。

このバージョン2.3.1の新機能:

この機能が追加されました:
lxml.html.cleanの新しいオプションのkill_tagsは、特定のタグとその内容(すなわち、それらのサブツリー全体)を削除します。
pi.get()処理命令のテキストコンテンツから擬似属性を解析するための命令を処理する上でpi.attrib。
lxml.get_includeは()lxml.etreeに対する外部Cコードをコンパイルするために使用することができますパスを含むのリストを返します。これは、具体的に静的にリンクlxmlのために必要とされるコードは、それ自体lxmlのとまったく同じヘッダファイルのバージョンに対してコンパイルする必要があるときに構築します。
Resolver.resolve_file()は、ファイル(様)オブジェクトが読み取りまたはないの後に閉鎖された場合に設定し、追加のオプションclose_fileを取ります。ユーザーは、それへの参照を保持することが期待されていないように、デフォルトでは、ファイルは、閉じられます。
バグ修正:
リンク:HTMLのクリーニングは「データ」を削除しませんでした。
html5libパーサーの統合が、今では、ライブラリの新しいリリースでは動作になりhtml5lib自体に「公式の」実装を使用しています。
対応する開始イベントがデフォルトの名前空間にあるように、同じプレインタグ名を推測する際lxml.saxで、endElementNSは()が誤っプレインタグ名を拒否することができます。
開いているファイルのようなオブジェクトは、パース(に渡された場合)またはiterparse()、パーサは、もはや使用した後、それを閉じません。これは、すべてのファイルがクローズされるlxmlの2.3の変更を元に戻します。また、エラーの場合には、オブジェクト正しくファイル(様)を閉じるようにユーザーの責任です。
lxml.html.cleanerでアサーションエラー最上位の要素を捨てます。
lxml.cssselectでは、(CSSの子孫セレクタの代わりに「A /子孫:: B 'のXPathの(' A /子孫-または自己::ノード()/ B 'の略)' // B 'を使用します'B')。これは、WebKitのとFirefoxのセレクタの動作と一致するように、いくつかのエッジケースを行い、(XSLで使用するために:テンプレート一致)よりCSS式の有効なロケーション·パスを作成します。
lxml.htmlでは、非選択&#x3c;オプション&#のSpark Proの。タグは、もはや収集フォームの値に表示されません。
追加/削除&#のx3c;オプション&#Spark Proのを。複数選択フォームフィールドの値には/それらを適切に選択し、それらを選択解除します。
その他の変更:
静的--download-dirオプションで、ダウンロードディレクトリを指定することができます構築します。

このバージョン2.3の新機能:

この機能が追加されました:
子供たちを探したときに、親の名前空間とは対照的に、lxml.objectifyは、空の名前空間を意味するものとして '{}タグ」をとります。
バグ修正:
ファイルオブジェクトからの読み込みが終了すると、パーサーはただちにその.close()メソッドを呼び出します。
構文解析が終了すると、iterparse()は直ちに、入力ファイルを閉じます。
(libxml2の2.7.8で修正された)重度壊れた文書を解析した後、非機能状態でHTMLパーサを残すことができるのlibxml2のバグの回避策。
HTMLのクリーンアップコードでマーキータグが正しくマーキーという名前です。
その他の変更:
CythonレベルのC-APIの一部のパブリック関数は、より明示的な戻り値の型を持っています。

このバージョン2.3beta1の新機能です:

このバグは修正:
新しいlibxml2のバージョンでクラッシュ置き換えXIncludeのノードの属性を持っていた文書間の要素を移動させます。
XMLID()関数は、オプションのパーサーとBASE_URLパラメータがありませんでした。
iterparseでワイルドカード·タグの検索()はPY3に壊れていました。
lxml.html.open_in_browserは()によるos.tempnamの使用にはPython 3で動作しませんでした。今では、オプションの「エンコーディング」パラメータを取ります。

同じようなソフトウェア

Dulwich
Dulwich

12 Apr 15

promise
promise

28 Feb 15

ATpy
ATpy

5 Jun 15

iso3166 (Python)
iso3166 (Python)

28 Feb 15

へのコメント lxml

コメントが見つかりません
コメントを追加
画像をオンにする!
カテゴリから探す