PDFはOCR変換コマンドラインスキャンしたPDFから文字を認識し、光学式文字認識技術を用いたテキスト文書のテキストに画像からテキストを抽出することができるテキストに。コマンドラインアプリケーションは、スクリプトを使用してバッチ処理を実行するための便利であり、また効果的なオプションで制御する手動の利便性を提供します。光学式文字認識(OCR)は、印刷または電子文字ベースのテキストファイルに書き込まターン視覚認識プロセスです。 PDF文書にスキャンされ、変換された文書は、文字認識ソフトウェアは、PDFの各文字画像を解釈し、それを、そのようなテキストとして、編集可能なフォーマットに入力することができる電子文字ベースのファイルを割り当てることができるための基礎を提供しますまたはWord文書。
スキャンしたPDFから
多くの文書は、画像形式で実際にスキャンしたPDFに格納されています。これらの文書は、アーカイブやインデックス作成のために簡単ではありません。 OCR変換CMDをテキストにPDFは、スキャンしたPDF内の単語やテキストを認識するための良いヘルパーです。
画像からテキスト文書を b.Extractテキスト
スキャナ、あるいは写真から作成されたドキュメント内のテキストをコピーまたは編集するには、常に時間がかかります。このアプリケーションは、画像内のテキストメッセージに対処するあなたの時間の多くを節約するOCR技術と画像内のテキストを認識することができます。
c.Easyコマンドライン操作とバッチ処理
これは、スクリプトを使用してバッチ処理を実行するための便利なコマンドラインアプリケーションです。コマンドラインアプリケーションはまた、効果的なオプションを備えた手動制御するための利便性を提供します。コマンド、バッチおよび手動制御では、すべて簡単にできます。
OCR変換コマンドラインをテキストにPDFの特徴:
1.Convertは、編集可能なテキストファイルにPDFファイルをスキャンしました。
このようなTIFF、BMP、PNG、JPG、PCX、およびTGAなどの画像から2.Recognize文字。
3.Convertは、(情報のURLから言語パッケージをダウンロードします)ソースファイルのページを指定しました。
4.NoサードパーティのPDFリーダーアプリケーションに必要。
5.Support以上の10の言語。
PDFソースファイルの元のレイアウトを保持する6.Able。
読み上げ順序のレイアウトでテキストにPDFに変換する7.Able。
バッチ処理のために有用である8.Supportコマンドライン操作。
制限:
この100用トライアルます。
コメントが見つかりません