OCR（光学文字認識）とは何ですか？

光学式文字認識（OCR）は、印刷物を簡単に編集および保存できるテキストまたはワープロファイルに変換するプロセスです。この技術により、そのような資料は、ハードコピー資料よりもはるかに少ない保管スペースで保管できます。 OCRテクノロジーは、情報の保存、共有、編集の方法に大きな影響を与えました。光学式文字認識の前に、誰かが本をワードプロセッシングファイルに変換したい場合、各ページは単語ごとに入力する必要があります。

OCRテクノロジーには、ハードウェアとソフトウェアの両方が必要です。さらに、洗練されたOCRシステムでは、プロセスを完了するためにコンピューター自体に追加の回路基板が必要です。光学スキャナーはページ上のテキストをスキャンし、フォントをビットマップと呼ばれる一連のドットに分割します。ソフトウェアは、最も一般的なフォントを読み取り、行の始まりと終わりを区別できます。このビットマップは、コンピューターのテキストに変換されます。

近年、光学式文字認識は大きな進歩を遂げましたが、手書き文字や手書き文字に似たフォントの認識において、常にうまく機能するとは限りません。銀行業界には、OCRテクノロジーを使用して手書きの小切手の金額を読み取ろうとするシステムがあり、ルーティングおよび口座番号を読み取るコンピューターの能力に沿っています。

OCRの力を理解するには、実際の例を見てみるとよいでしょう。広大なファイルキャビネットにすべての犯罪記録が保存されている警察署を想像してください。数百万のページをスキャンするのは費用と時間がかかる作業ですが、そのメリットは膨大です。

OCRシステムがページをコンピューターで読み取り可能なテキストに変換すると、たとえば、探偵は数秒で履歴全体を検索できます。特定のレコードを手動で見つけることはそれほど難しくないかもしれませんが、8：00〜8:30の特定の交差点で行われたすべての犯罪を探そうとする探偵を想像してください。この例は、検索可能なテキストの力の表面をほんの少しだけ説明したものであり、多くの企業や機関がレガシーデータのOCRに数百万ドルを費やしているのは、その理由の1つにすぎません。

この記事は参考になりましたか？