lxmlのラッパーとして設計され、今では普通にHTMLデータマイニングに必要なすべての機能がlxmlのを展開します。
の特長の:ます。
- 一般的な特徴:
- ニースjQueryのようなCSSセレクタます。
- 要素への簡単なアクセスの属性します。
- 他の形式に変換HTMLのための簡単な方法(详细、Markdownを、など)します。
- テキストを操作するためのいくつかの素晴らしい機能がします。
- lxmlのすべてのオリジナルの特徴を保存します。
- 機能は、純粋なテキストで動作するように:
- to_unicode - Unicode文字列に文字列を変換します。
- strip_accents - 文字列からストリップのアクセントます。
- strip_symbols - 文字列からストリップ醜いUnicodeの記号ます。
- strip_spaces - 文字列から余分なスペースを削除します。
- strip_linebreaks - 文字列から余分な改行を削除します。
の要件の
- lxmlの
コメントが見つかりません