lxml

ソフトウェアのスクリーンショット:
lxml
ソフトウェアの詳細:
バージョン: 3.4.1
日付のアップロード: 17 Feb 15
開発者: Martijn Faassen
ライセンス: 無料
人気: 12

Rating: nan/5 (Total Votes: 0)

lxmlのは彼らのPython code.An XML処理librarylxmlは、XML(拡張マークアップ言語であるPythonの開発者は、XMLとHTMLファイルの両方インサイダーで作業できるように、libxml2のとlibxsltのライブラリを結合し、洗練された強力な、自由でユニークなPythonモジュールです)具体的にできるだけElementTreeのAPI仕様に従うように設計されたPythonプログラミング言語で書かれたライブラリを処理する。
それはetc.UseのlxmlのからPythonコードを呼び出すために、そのようなNG(次世代)、XPathを、XMLスキーマ、C14N、XSLT(拡張スタイルシート言語)をリラックスとしてlibxsltはとのlibxml2ライブラリの特定の機能を、公開するのElementTree APIを拡張することができますXSLTのstylesheetsDevelopersは、拡張関数を経由してXSLTスタイルシートとXPath式からPythonコードを呼び出すためにlxmlのプログラムを使用することができます。チュートリアルの幅広いプロジェクト&rsquoの上ご利用いただけます。のホームページ(記事の最後にあるリンクを参照してください)​​。
ソフトウェアは、設計によって、オープンソースであるとPython&rsquoののシンプルさと、前述のライブラリの特徴完全性とスピードを兼ね備え; S(アプリケーション·プログラミング·インタフェース).GettingがlxmlItを開始APIが使用してGNU / Linuxディストリビューションでlxmlのをインストールするのはとても簡単ですソースアーカイブSoftowareとプロジェクト&rsquoの上に分布する。の公式サイト。単純に、ソースパッケージをダウンロードあなたのホームディレクトリに保存し、それを解凍し、ターミナルアプリを開き、抽出されたアーカイブファイル(例:cd /home/softoware/lxml-3.4.1)の場所に移動します。
&lsquoを実行します。作る&rsquoの。現代のコンピュータ上で約1〜2分を取る必要があり、プログラムをコンパイルするためのコマンド。コンパイルが成功した後、&lsquoを実行し、インストール&rsquoの作る。ルートとして、またはコマンド‘ sudoがインストール&rsquoの作る。 lxmlのシステムwide.Supports GNU / LinuxとMicrosoft WindowsオペレーティングsystemsTheソフトウェアをインストールするには、特権ユーザとしてコマンドを正式にGNU / LinuxとMicrosoft Windowsオペレーティングシステムでサポートされています。それは成功して、32ビットおよび64ビットコンピュータ上でテストされています。

の新機能であるの今回のリリースで:ます。

  • 特長追加:

  • インクリメンタルXMLFILEのシリアル化APIを伴うために
  • 新規HTMLFILE HTMLジェネレータ。ブラクアルスラーンによるパッチます。
  • バグ修正:
  • lxml.sax.ElementTreeContentHandlerはスーパークラスを初期化しませんでしたします。

バージョン3.3.1の新機能のは何ですか。

  • バグ修正:
  • のLP#1014290:parser.feedで解析HTMLドキュメント()タグ反復中の要素を見つけることができませんでした。

  • PyPyはのC-APIでPyPyはでビルによるものPyUnicode_Compare(のための行方不明のサポートに失敗した)とPyByteArray _ *()
  • のLP#1273709。
  • のLP#1274413:MSVCでコンパイルが欠落&QUOTに失敗しました。stdint.h&QUOT。標準のヘッダファイルます。
  • のLP#1274118:iterparse()がBOMがファイルを先頭に解析に失敗します。

の新機能のバージョンでは3.0アルファ2:

  • 追加された機能:
  • 要素の.iter()メソッドは、現在のタグのような引数&QUOTを受け入れる; {*}名前&QUOT。任意の名前空間内の指定されたローカル名を持つ要素を検索します。この追加により、予想通り、ワイルドカードのすべての組み合わせが動作するようになりました。" {NS}名前&QUOT ;," {}名前&QUOT ;," {*}名前&QUOT ;," {NS} *&QUOT ;," {} * &QUOT。そして" {*} *&QUOT ;.名前"それ&QUOTに注意してください。 {}名前&QUOT ;,しかし" *&QUOT QUOTから&と等価です。ある" {*} *&QUOT ;. strip_attributes()、strip_elements()とに対してstrip_tags()関数、同じ変更は.getiterator()、.itersiblings()、.iterancestors()、.iterdescendants()、.iterchildren()と.itertext()メソッドに適用されます同様にiterparse()クラスます。
  • C14Nは、排他的な直列化の際に、トップレベルに昇格させるための包括的な接頭辞を指定することができます。
  • バグ修正:
  • フィード()パーサインタフェースに長いUnicode文字列を渡すには、文字列全体を読み取ることができませんでした。

バージョン2.3.5の新機能のは何ですか。

  • クラッシュelement.removeでテキストノードをマージ( )します。
  • サックス/ターゲット·パーサーでクラッシュ空のDOCTYPEを報告します。

  • nsMapにを構築するときに(要素プロパティ)

    • クラッシュ:

    のバージョン2.3.4でのの新機能である空の名前空間URIます。
    原因競合状態に

  • クラッシュエラー(またはユーザメッセージ)は、ねじXSLT処理中に発生します。
  • XSLTスタイルシートのコンパイルは、コンパイル·エラーを無視することができます。

バージョン2.3.2の新機能のは何ですか。

  • 機能を追加しました:
  • lxml.objectify.deannotate()客観名前空間宣言を削除する(と一般的には名前空間宣言をクリーンアップ)型注釈を削除した後に、新しいブールオプションcleanup_namespacesを持っています。
  • lxml.objectifyは、ユーザ側のlxml.etreeのそうでなければ、冗長インポートを回避するためにetree.SubElementのコピーとして、独自のサブ要素()関数を獲得します。
  • バグ修正:
  • 固定&QUOT、子孫&QUOT。 cssselectのバグ(lxmlの2.3.1の最初の修正後)に二度目。前回の変更は、変換された表現のXPathをベース評価のための重大なパフォーマンスの低下をもたらした。これは以前に2.3.1で働いていたのXSLTロケーションパスとして生成されたXPath式の一部の使用を破ることに注意します。
  • cssselectでいくつかのセレクタの固定された構文解析。コンビネータ&QUOT後に空白。 >&QUOT ;," +&QUOT。そして"〜&QUOT。正しく無視されます。以前は子孫コンビネータとして解析されたされている。たとえば、" DIV&GT。 .fooという&QUOT。と同じように解析された" DIV> * .fooという&QUOT。 DIV>代わりに&QUOTの.fooという"ます。

のバージョン2.3.1で新しいのは何ですか。

  • 機能を追加しました:
  • 新規オプションは、特定のタグを削除し、その内容(すなわち、それらの全体サブツリー)するlxml.html.cleanにkill_tagsます。

  • 処理命令のテキストコンテンツから擬似属性を解析する処理命令の
  • pi.get()とpi.attribます。
  • lxml.get_include()lxml.etreeに対する外部Cコードをコンパイルするために使用することができインクルードパスのリストを返します。これは、具体的に静的にリンクlxmlのために必要とされるコードは、それ自体lxmlのとまったく同じヘッダファイルのバージョンに対してコンパイルする必要があるときにビルドをします。
  • Resolver.resolve_file()はファイル(ライク)場合に設定し、追加のオプションclose_fileを取るオブジェクトは、読んだ後か閉じられます。ユーザは、それへの参照を保持しないと予想されるように、デフォルトでは、ファイルは、クローズされます。
  • バグ修正:
  • はHTMLクリーニングは「データ: '削除されませんでした。リンクをします。
  • html5libパーサの統合は、今では、ライブラリの新しいリリースでは動作しますhtml5lib自体の「公式」の実装を、使用しています。

  • 対応する開始イベントがデフォルトの名前空間にあると同じプレインタグ名を推測する際にlxml.saxの
  • 、endElementNS()は間違ってプレインタグ名を拒否することができます。

  • オープンファイル類似のオブジェクトが(解析に渡される
  • )またはiterparse()、パーサはなくなり近いこと、使用後。これは、すべてのファイルがクローズされることになるlxmlの2.3の変更を元に戻します。また、エラーの場合には、適切にファイル(-like)オブジェクトをクローズするため、ユーザーの責任でます。
  • lxml.html.cleanerでアサーションエラートップレベル要素を破棄します。

  • lxml.cssselectの
  • 、CSSの代わりに「A /子孫:: B '(' A /子孫-または自己::ノード()/ B 'の略)のxpath' A // B 'を使用子孫セレクタ( 'B')。これはWebKitのとFirefox、セレクタの挙動と一致するように、いくつかのエッジケースを作成し、(XSLで使用するために:テンプレートマッチ)よりCSSの式の有効なロケーションパスになります。
  • lxml.html、非選択したタグでは、もはや収集フォームの値に表示されません。
  • 複数選択フォームフィールドから/に値を削除/追加するには、それらを適切に選択し、それらを選択解除します。
  • その他の変更:
  • 静的--download-dirオプションでダウンロードディレクトリを指定することができます構築します。

のバージョン2.3で新しいのは何ですか。

  • 機能を追加しました:

  • 子どもたちを探しているときに、親の名前空間とは対照的に、
  • は、lxml.objectifyは、空の名前空間を意味するものとして '{}タグ」をとります。
  • バグ修正:
  • はファイルのようなオブジェクトからの読み込みが終了すると、パーサは、すぐにその.close()メソッドを呼び出します。
  • の解析が終了したら、iterparse()はすぐ​​に入力ファイルを閉じます。
  • (libxml2の2.7.8で修正された)重度壊れた文書を解析した後に非機能状態のHTMLパーサを残すことができlibxml2のバグのための回避策ます。
  • HTMLのクリーンアップコード内のブランドタグが正しくマーキーという名前が付けられます。
  • その他の変更:
  • CythonレベルのC-APIの一部の公共の機能がより明示的な戻り値の型を持っています。

  • 時より新しいlibxml2のバージョンでは、

    • クラッシュ:

    のバージョン2.2.8 / 2.3ベータ1にの新機能である置き換えXIncludeのノード上の属性を持っていた文書間の要素を移動します。

  • XMLID()関数は、オプションのパーサとするか設定パラメータがありませんでしたします。
  • ()PY3に壊れていた。iterparseでワイルドカードタグの検索します。
  • lxml.html.open_in_browser()が原因os.tempnamの使用にはPython 3で動作しませんでした。今ではオプションの 'encoding'のパラメータを取ります。

の要件

  • のPythonます。

同じようなソフトウェア

relaxml
relaxml

20 Feb 15

vdexcsv
vdexcsv

11 May 15

MoinMoin
MoinMoin

20 Feb 15

WP2LaTeX
WP2LaTeX

20 Feb 15

開発者の他のソフトウェア Martijn Faassen

hurry.resource
hurry.resource

11 May 15

z3c.relationfield
z3c.relationfield

14 Apr 15

へのコメント lxml

コメントが見つかりません
コメントを追加
画像をオンにする!