CLIとRubyのライブラリの両方を保持している宝石、などもご用意します。
の特長の:ます。
- 検索可能なUTF- 8プレーンテキスト
- ページの画像やサムネイルます。
- PDFファイル
- シングルページ
- ドキュメントのメタデータ(タイトル、著者、ページ数...)
任意のフォーマットで
のこのリリースで新しいのあるもの:ます。
- LibreOfficeのサポートのためのバグ修正します。
のバージョン0.6.4でのの新機能:
- Docsplitのコマンドライン用の言語フラグを追加しました<。 / LI>
- 固定いくつかのバグします。
- pdftkの廃止のための準備します。
のバージョン0.6.0でのの新機能は次のとおりです。
- Docsplitは今任意で文書の砲撃処理する必要があります正しく、ファイル名の文字します。
- OCR用の画像の解像度が200〜400 DPIから倍増してきた - これは通常のドキュメントのために顕著な違いはないはずですが、細かいプリントに違いの世界を行います。 。
- Docsplitは現在、OCRの前にGraphicsMagickにの--despeckleを使用しています。
<李> --densityオプションは、文書から画像を生成する際にラスタライズの解像度を指定するために添加します。
のバージョン0.5.2でのの新機能:
- PDFへの透過的変換では、DocsplitはGraphicsMagickにを好むした(PNG、GIF、JPG、JPEG、TIF、TIFF、BMP、PNM、PPM、SVG、EPS) :ファイル形式はGraphicsMagickには読み取ることができるものであるOpenOfficeの、オーバー
コメントが見つかりません