Skip to main content

Ano ang OCR (Optical Character Recognition)?

Ang Optical Character Recognition (OCR) ay isang proseso ng pag -convert ng mga nakalimbag na materyales sa mga file ng pagproseso ng teksto o salita na madaling ma -edit at maiimbak.Pinagana ng teknolohiya ang mga naturang materyales na maiimbak gamit ang mas kaunting puwang sa pag -iimbak kaysa sa mga hard copy na materyales.Ang teknolohiya ng OCR ay gumawa ng isang malaking epekto sa paraan ng pag -imbak ng impormasyon, ibinahagi at na -edit.Bago ang pagkilala sa optical character, kung nais ng isang tao na gawing isang libro ang isang file sa pagproseso ng salita, ang bawat pahina ay kailangang mai -type na salita para sa salita.

Ang teknolohiya ng OCR ay nangangailangan ng parehong hardware at software.Bilang karagdagan, ang sopistikadong mga sistema ng OCR ay nangangailangan ng isang karagdagang circuit board sa computer mismo upang makumpleto ang proseso.Ang isang optical scanner ay nag -scan ng teksto sa isang pahina, pagkatapos ay masira ang mga font sa isang serye ng mga tuldok na tinatawag na isang bitmap.Maaaring basahin ng software ang pinaka -karaniwang mga font at makilala kung saan nagsisimula at huminto ang mga linya.Ang bitmap na ito ay pagkatapos ay isinalin sa teksto ng computer.Mayroong mga system sa loob ng industriya ng pagbabangko na gumagamit ng teknolohiya ng OCR upang subukang basahin ang mga halaga sa mga tseke na nakasulat sa kamay, upang sumama sa kakayahang basahin ng mga computer ang mga numero ng ruta at account.

upang magbigay ng isang ideya ng kapangyarihan ng OCR,Makakatulong ito upang tumingin sa isang halimbawa ng tunay na mundo.Isipin ang isang kagawaran ng pulisya na mayroong lahat ng mga kriminal na talaan na nakaimbak sa malawak na mga cabinets ng file.Bagaman ang pag-scan ng milyun-milyong mga pahina ay magiging isang mamahaling at pag-ubos ng oras, napakalaki ng mga benepisyo.Ilang segundo.Ang mano -manong paghahanap ng isang partikular na tala ay maaaring hindi masyadong mahirap, ngunit isipin ang isang tiktik na nagsisikap na maghanap para sa lahat ng mga krimen na nagawa sa isang tiyak na intersection sa pagitan ng 8:00 at 8:30.Ang halimbawang ito ay nag -scratches lamang sa ibabaw ng lakas ng mahahanap na teksto, at ito ay isang kadahilanan na maraming mga kumpanya at institusyon ang gumagastos ng milyun -milyong dolyar sa OCR ang kanilang data ng legacy.