Skip to main content

Hvordan vælger jeg den bedste OCR -software?

OCR -software eller optisk karaktergenkendelsessoftware er software designet til at oversætte billeder af tekst til faktisk tekst, som en computer kan læse.Generelt bruges OCR -software, efter at et billede er blevet scannet til en computer, selvom andre former for input også kan bruges.OCR -software fungerer bedst på tekst, der allerede er skrevet, enten i tilfælde, hvor en original udskrivning er gået tabt, eller i scanningsark, der er skrevet på en skrivemaskine.God software kan dog også være i stand til at oversætte håndskrevet tekst, selvom fejlfrekvensen på denne slags konvertering har en tendens til at være meget højere.

Det faktiske udtryk

software

er lidt vildledende, da de fleste moderne OCR -software ikke er iFakta bruger optisk karaktergenkendelse, men bruger faktisk digital karaktergenkendelse.Dette skyldes, at felterne for nogle år siden fusionerede effektivt, og begge felter vedtog den mere attraktive udtryk optiske karaktergenkendelse.OCR -software har avanceret meget i de senere år, med moderne programmer, der er væsentligt bedre end deres forgængere til at identificere tekst.

Faktisk krævede tidlig OCR -software at uddanne programmet på en bestemt skrifttype, før det kunne indtastes nøjagtigt.Tilsvarende, når du indtaster håndskrift, skulle programmet blive trænet, en proces, der kan være utroligt tidskrævende.Metoder er dog forbedret, og mere intelligente systemer er nu normen.De anvendte metoder er nu relativt statiske, hvor kun en lille smule forskning går til at udvikle helt nye metoder, og mest forskning, der går i raffinering af eksisterende procedurer for at gøre dem stadig mere nøjagtige.Tidlig OCR-software blev brugt i en lang række applikationer, hvor store virksomheder brugte det til at læse kreditkortaftryk i 1950'erne, og USAs posttjeneste ved hjælp af den til at sortere mail siden midten af 1960'erne. Ti ti år siden, valgteEt stykke OCR -software var vanskeligt, da mange programmer var ret dårlige ved visse opgaver og rimeligt godt hos andre.I disse dage er feltet imidlertid stort set blevet udjævnet.Nøjagtighedsrater i enhver god OCR -software til oversættelse af latinske scripts, der er skrevet, er over 99%.Når det kommer til at indtaste håndskrift, eller mere indviklede skrifttyper, har OCR -software stadig en relativt høj rækkevidde.

Omkostningerne ved OCR -software svinger også også vidt, ofte i forhold til den nøjagtighedshastighed, den kan prale af.Der findes en god mængde gratis OCR -software, der er egnet til at indtaste trykt stof, og nogle kan findes, som er relativt god til at detektere håndskrift, især med en vis træning.Dyrere software -suiter, såsom Omnipage Suite, der koster omkring $ 100 amerikanske dollars (USD) til hjemmeversionen og omkring $ 450 USD for den professionelle version, kan prale af imponerende arrays af funktioner og generelt højere succesrater.

Desværre er der stadig ikke sådan noget som perfekt OCR -software, så det at vælge et program til at købe stort set kan være en frustrerende proces.Selv de bedste programmer vil sandsynligvis have en vanskelig tid med håndskrift, og fejl vil uundgåeligt krybe igennem, selv på lave niveauer.For det meste kommer det at vælge et program til at købe ekstra funktioner: multi-lingual support, one-touch scanning og konverteringsintegration, automatisk PDF-konvertering og anerkendelse af hele ord på tværs af specialiserede discipliner som juridiske og medicinske områder.