Skip to main content

OCRとは何ですか(光学文字認識)?

光学文字認識(OCR)は、印刷された素材を簡単に編集および保存できるテキストまたはワードプロセッシングファイルに変換するプロセスです。このテクノロジーにより、このような材料は、ハードコピー材料よりもはるかに少ないストレージスペースを使用して保管できます。OCRテクノロジーは、情報の保存、共有、編集の方法に大きな影響を与えました。光学文字認識の前に、誰かが本をワードプロセッシングファイルに変えたい場合、各ページは単語に合わせて入力する必要があります。さらに、洗練されたOCRシステムでは、プロセスを完了するためにコンピューター自体に追加の回路基板が必要です。光学スキャナーはページ上のテキストをスキャンし、フォントをビットマップと呼ばれる一連のドットに分割します。ソフトウェアは、最も一般的なフォントを読み取り、行がどこで開始されて停止するかを区別できます。このビットマップはコンピューターテキストに翻訳されます。OCRテクノロジーを使用して、手書きのチェックの金額を読み、コンピューターに合わせてルーティングとアカウント番号を読み取る能力に合わせて、銀行業界内にシステムがあります。実世界の例を見るのに役立ちます。すべての犯罪歴があり、広大なファイルキャビネットに保管されている警察署を想像してください。何百万ページものページをスキャンすることは高価で時間のかかる取り組みですが、利点は膨大です。数秒。特定の記録を手動で見つけることはそれほど難しくないかもしれませんが、8:00から8:30の間に特定の交差点で犯されたすべての犯罪を検索しようとする探偵を想像してください。この例は、検索可能なテキストの力の表面を傷つけるだけであり、多くの企業や機関が彼らの遺産データに数百万ドルを費やしている理由の1つにすぎません。