pdfminer3kは、Python 3で書かれたpdfminerのポートです。
PDFMinerは、PDF文書から情報を抽出するためのツールです。他のPDF関連のツールとは異なり、それはテキストデータを取得し、分析することに完全に焦点を当てています。
PDFMinerは、フォントや線などのページのテキストの正確な位置、ならびに他の情報を得ることを可能にする。それは、(HTMLなど)他のテキスト形式にPDFファイルを変換することができ、PDF変換器を含む。それは、代わりにテキスト分析の他の目的に使用することができる拡張可能なPDF解析を持っています。
のこのリリースではの新機能:ます。
- < LI>を追加しましたpdfexplore、それらのデータを探索することによりPDFファイルをデバッグするためのツールます。
- グループテキストボックスにしようとしないでくださいます。
- サポートオブジェクト参照します。
- とすぐのObjectIdが見つからないようにすべてのオブジェクトを解析します。
- STRICTベースのエラー処理のイディオムを改善しました。
(それは時間がかかりすぎる)あまりにも多くがあるとき
ストリーム内のフィルタのように
のバージョン1.2.4の新機能のは何ですか。
- 外部参照テーブルが壊れている場合には、解析してキャッシュすべてフォールバックのような物体ます。
- レイアウトで偽のアサーションを修正します。
のバージョン1.2.3でのの新機能である:不均一なCMAPコードにクラッシュを修正しました。
- 悪いPSParserののreprに起因するメタクラッシュを修正します。
の要件の
- のPythonます。
コメントが見つかりません