Skip to main content

Co je OCR (rozpoznávání optických znaků)?

Optické rozpoznávání znaků (OCR) je proces převodu tištěných materiálů na soubory zpracování textu nebo textu, které lze snadno upravit a ukládat.Tato technologie umožnila ukládat takové materiály pomocí mnohem méně úložného prostoru než tištěné materiály.Technologie OCR měla obrovský dopad na způsob, jakým jsou informace ukládány, sdíleny a upravovány.Před rozpoznáváním optického znaku, pokud by někdo chtěl proměnit knihu v soubor zpracování textu, každá stránka by musela být zadána slovo pro slovo.

Technologie OCR vyžaduje hardware i software.Sofistikované systémy OCR navíc vyžadují, aby tento proces dokončil další desku obvodů v samotném počítači.Optický skener skenuje text na stránce a poté rozbije písma na řadu teček nazývaných bitmap.Software může číst nejběžnější písma a rozlišovat, kde se linky začínají a zastavují.Tato bitmapa je poté přeložena do počítačového textu.

Zatímco rozpoznávání optických znaků dosáhlo v posledních letech obrovský pokrok, stále nefunguje vždy dobře při rozpoznávání rukopisu nebo písma, která vypadají podobně jako rukopis.V bankovním průmyslu existují systémy, které používají technologii OCR k pokusu o přečtení částek na ručně psaných kontrolách, aby šly spolu s schopností počítačů číst čísla směrování a účtů.

, aby poskytli představu o síle OCR,Může to pomoci podívat se na příklad skutečného světa.Představte si policejní oddělení, které má všechny své rejstříky trestů uložené v rozlehlých souborových skříních.Ačkoli skenování milionů stránek by bylo drahým a časově náročným podnikem, výhody jsou obrovské.pár sekund.Ruční nalezení konkrétního záznamu nemusí být příliš obtížné, ale představte si detektiv, který se snaží hledat všechny zločiny spáchané na určité křižovatce mezi 8:00 a 8:30.Tento příklad poškrábají povrch síly prohledávatelného textu a je to jen jeden z důvodů, proč mnoho společností a institucí utrácí miliony dolarů na OCR jejich dědictví.