この光学式文字認識(OCR)は、ASCIIなどの文字コードに印刷したり、書かれたテキスト文字を光学的にスキャンされたビットマップの翻訳である。これは、編集され、それ以外のコンピュータ上で操作可能なデータファイルにハードコピー材料をオンにする効率的な方法である。これは長い間、電子的に長い文書を迅速に利用できるようにするライブラリや政府機関で使用される技術です。 OCR技術の進歩は、企業がその使用が増加に拍車をかけている。多くの文書入力のタスクの場合、OCRは、利用可能な最も費用対効果と迅速な方法である。毎年、技術は一度ファイルキャビネットや紙文書の完全な箱にオーバー与えられた収納スペースのエーカーを解放します。 OCRを使用する前に、原料物質は、ビットマップ(ドットパターン)としてページを読み取るための光学スキャナ(時にはPCに特化した回路基板)を用いてスキャンされなければならない。画像を認識するためのソフトウェアも必要です。
当社のソフトウェアパッケージは、UJIペン文字ニューラルネットワークを使用したデータセットの孤立した手書き文字と数字の分類を解決するために提案している。データは、26文字のサンプルとタブレットPCの11作家によって書かれた10桁の数字で構成されています。 (標準UNIPEN形式)の文字は大文字と小文字の両方に書き込まれ、作家ごとの文字の全体の2セットがあります。だから、出力は35クラスのいずれかにする必要があります。究極の目的は、各文字のライター独立したモデルを構築しています。
価値ある機能の選択は、したがって、特徴の新たな有効セット文字認識において非常に重要である、C. Agellにより導入された制服微分正規化座標(UDNC)は、採用されている。これらの特徴は、それらがニューラルネットワークを訓練し、UJIペン文字データセットにその性能をテストするために使用されるように、単純な分類アルゴリズムを使用して認識率を改善することが示されている。
索引用語:Matlabの、ソース、コード、OCR、光学式文字認識、スキャンしたテキスト、書かれたテキスト、アスキー、孤立した文字
の要件の
Matlabの
コメントが見つかりません