Skip to main content

Hoe kies ik de beste OCR -software?

OCR -software, of optische tekenherkenningssoftware, is software die is ontworpen om afbeeldingen van tekst te vertalen in echte tekst die een computer kan lezen.Over het algemeen wordt OCR -software gebruikt nadat een afbeelding in een computer is gescand, hoewel ook andere vormen van invoer kunnen worden gebruikt.OCR -software werkt het beste op tekst die al is getypt, hetzij in gevallen waarin een originele afdruk verloren is gegaan, of in scanbladen getypt op een typemachine.Goede software kan mogelijk ook handgeschreven tekst vertalen, hoewel het foutenpercentage op dit soort conversie vaak veel hoger is.

De werkelijke term ocr -software is een beetje misleidend, omdat de meeste moderne OCR -software niet inFeit gebruikt optische karakterherkenning, maar gebruikt eigenlijk digitale karakterherkenning.Dit komt omdat enkele jaren geleden de velden effectief fuseerden en beide velden de aantrekkelijkere term optische karakterherkenning hebben aangenomen.OCR Software is de afgelopen jaren veel vooruitgegaan, met moderne programma's aanzienlijk beter dan hun voorgangers bij het identificeren van tekst.

In feite vereiste vroege OCR -software het programma op een specifiek lettertype te trainen voordat het nauwkeurig kon worden ingevoerd.Evenzo zou het programma bij het invoeren van handschrift moeten worden getraind, een proces dat ongelooflijk tijdrovend zou kunnen zijn.Methoden zijn echter verbeterd en meer intelligente systemen zijn nu de norm.De gebruikte methoden zijn nu relatief statisch, met slechts een beetje onderzoek naar het ontwikkelen van geheel nieuwe methoden, en het meeste onderzoek naar het verfijnen van bestaande procedures om ze steeds nauwkeuriger te maken.Vroege OCR-software werd gebruikt in een breed scala aan applicaties, waarbij grote bedrijven het gebruikten om in de jaren vijftig creditcardafdrukken te lezen, en de Postal Service van de Verenigde Staten die het sinds het midden van de jaren zestig sorteren.Een stuk OCR -software was moeilijk, omdat veel programma's behoorlijk slecht waren in bepaalde taken en redelijk goed in andere.Tegenwoordig is het veld echter grotendeels geëgaliseerd.Nauwkeurigheidspercentages in goede OCR -software voor het vertalen van Latijnse scripts die zijn getypt, zijn hoger dan 99%.Als het gaat om het invoeren van handschrift, of meer ingewikkelde lettertypen, heeft OCR -software echter nog steeds een relatief hoog bereik.

De kosten van OCR -software fluctueren ook breed, vaak in relatie tot de nauwkeurigheidspercentages die het beschikt.Er is een behoorlijke hoeveelheid gratis OCR -software te vinden die geschikt is voor het invoeren van gedrukte materie, en sommige kunnen worden gevonden die relatief goed zijn in het detecteren van handschrift, vooral met enige training.Dure softwaresuites, zoals de Omnipage Suite, die ongeveer $ 100 US dollar (USD) kost voor de thuisversie en ongeveer $ 450 USD voor de professionele versie, beschikt over indrukwekkende arrays van functies en over het algemeen hogere slagingspercentages.

Helaas bestaat er nog steeds niet zoiets als perfecte OCR -software, dus het kiezen van een programma om te kopen kan nog steeds grotendeels een frustrerend proces zijn.Zelfs de beste programma's zullen het waarschijnlijk moeilijk hebben met handschrift, en fouten zullen onvermijdelijk doorkruisen, zelfs op lage niveaus.Meestal komt het kiezen van een programma om te kopen neer op extra functies: multi-lingual ondersteuning, one-touch scan en conversie-integratie, automatische PDF-conversie en herkenning van de hele woorden op gespecialiseerde disciplines zoals juridische en medische gebieden.