Skip to main content

Hvordan velger jeg den beste OCR -programvaren?

OCR -programvare, eller programvare for optisk karaktergjenkjenning, er programvare designet for å oversette bilder av tekst til faktisk tekst som en datamaskin kan lese.Generelt brukes OCR -programvare etter at et bilde er blitt skannet til en datamaskin, selv om andre former for inngang også kan brukes.OCR -programvaren fungerer best på tekst som allerede er skrevet, enten i tilfeller der en original utskrift har gått tapt, eller i skanneark skrevet på en skrivemaskin.God programvare kan imidlertid også være i stand til å oversette håndskrevet tekst, selv om feilraten på denne typen konvertering har en tendens til å være mye høyere.

Det faktiske uttrykket OCR -programvaren er litt misvisende, ettersom de fleste moderne OCR -programvaren ikke gjørFaktisk bruker optisk karaktergjenkjenning, men bruker faktisk digital karaktergjenkjenning.Dette fordi for noen år siden feltene effektivt slo seg sammen, og begge feltene vedtok den mer attraktive betegnelsen optisk karaktergjenkjenning.Tilsvarende, når du legger inn håndskrift, må programmet trenes, en prosess som kan være utrolig tidkrevende.Metodene har imidlertid forbedret seg, og mer intelligente systemer er nå normen.Metodene som brukes er nå relativt statiske, med bare litt forskning som går ut på å utvikle helt nye metoder, og mest forskning som går ut på å foredle eksisterende prosedyrer for å gjøre dem stadig mer nøyaktige.Tidlig OCR-programvare ble brukt i et bredt spekter av applikasjoner, med store selskaper som brukte den til å lese kredittkortavtrykk på 1950-tallet, og USAEt stykke OCR -programvare var vanskelig, ettersom mange programmer var ganske dårlige på visse oppgaver, og rimelig bra på andre.I disse dager har imidlertid feltet i stor grad blitt utjevnet.Nøyaktighetsgraden i en hvilken som helst god OCR -programvare for å oversette latinske skript som er skrevet er over 99%.Når det gjelder å legge inn håndskrift, eller mer intrikate skrifttyper, har OCR -programvaren fremdeles et relativt høyt område.

Kostnaden for OCR -programvare svinger også bredt, ofte i forhold til nøyaktighetsgraden den kan skryte av.En god del gratis OCR -programvare finner du som er egnet for å legge inn trykt materiale, og noen kan bli funnet som er relativt god til å oppdage håndskrift, spesielt med litt trening.Dyrere programvaresuiter, for eksempel Omnipage Suite, som koster rundt $ 100 amerikanske dollar (USD) for hjemmeversjonen og rundt $ 450 USD for den profesjonelle versjonen, kan skilte med imponerende matriser av funksjoner og generelt høyere suksessrater.

Dessverre er det fremdeles ikke noe som heter perfekt OCR -programvare, så det å velge et program å kjøpe kan fremdeles i stor grad være en frustrerende prosess.Selv de beste programmene vil sannsynligvis ha en vanskelig tid med håndskrift, og feil vil uunngåelig krype gjennom, selv på lave nivåer.For det meste kommer det å velge et program å kjøpe ned til ekstra funksjoner: flerspråklig støtte, en-touch-skanning og konverteringsintegrasjon, automatisk PDF-konvertering og anerkjennelse av hele ord på tvers av spesialiserte fagområder som juridiske og medisinske felt.