Skip to main content

Mi az OCR (optikai karakterfelismerés)?

Az optikai karakterfelismerés (OCR) a nyomtatott anyagok szöveg- vagy szövegszerkesztési fájlokká történő konvertálásának folyamata, amelyet könnyen szerkeszthetünk és tárolhatunk.A technológia lehetővé tette az ilyen anyagok tárolását sokkal kevesebb tárhely felhasználásával, mint a nyomtatott anyagok.Az OCR technológia óriási hatást gyakorolt az információk tárolására, megosztására és szerkesztésére.Az optikai karakter -felismerés előtt, ha valaki egy könyvet szövegszerkesztő fájlmá akarja változtatni, akkor minden oldalt szóba kell gépelni.

Az OCR technológiához mind hardver, mind szoftver szükséges.Ezenkívül a kifinomult OCR rendszerekhez a számítógép befejezéséhez további áramköri kártyát igényelnek.Egy optikai szkenner beolvassa a szöveget egy oldalra, majd bontja a betűkészleteket egy bitmap nevű pontok sorozatára.A szoftver képes olvasni a leggyakoribb betűtípusokat, és megkülönböztetheti, ahol a vonalak indulnak és megállnak.Ezt a bitképet ezután lefordítják a számítógépes szövegbe.A bankiparban vannak olyan rendszerek, amelyek az OCR technológiát használják a kézzel írt csekkek összegeinek elolvasására, hogy együtt menjenek a számítógép útválasztási és számlaszámainak elolvasására.Segíthet egy valós példa áttekintésében.Képzeljünk el egy rendőrséget, amelyben az összes bűnügyi nyilvántartása hatalmas iratszekrényekben tárolja.Noha az oldalak millióinak szkennelése drága és időigényes vállalkozás lenne, az előnyök hatalmasak.Néhány másodperc.Lehet, hogy egy adott rekord kézi megtalálása nem túl nehéz, de képzelje el, hogy egy nyomozó megpróbálja keresni az összes elkövetett bűncselekményt egy bizonyos kereszteződésen 8:00 és 8:30 között.Ez a példa csak megkarcolja a kereshető szöveg hatalmának felületét, és csak egy oka annak, hogy sok vállalat és intézmény millió dollárt költenek örökölt adataik OCR -jére.