Skip to main content

Hur väljer jag den bästa OCR -programvaran?

OCR -programvara, eller optisk karaktärigenkänningsprogramvara, är programvara utformad för att översätta bilder av text till faktisk text som en dator kan läsa.Generellt används OCR -programvara efter att en bild har skannats in i en dator, även om andra former av inmatning också kan användas.OCR -programvaran fungerar bäst på text som redan har skrivits, antingen i fall där en originalutskrift har gått förlorad eller i skanning av ark skrivna på en skrivmaskin.God programvara kanske också kan översätta handskriven text, även om felfrekvensen för denna typ av konvertering tenderar att vara mycket högre.

Den faktiska termen OCR -programvara är lite vilseledande, eftersom de flesta moderna OCR -programvaror inte finns iFakta använder optiskt karaktärigenkänning, men använder faktiskt digitalt karaktärigenkänning.Detta beror på att fälten för några år sedan effektivt slogs samman, och båda fälten antog det mer attraktiva termen optisk karaktärigenkänning.OCR -programvara har avancerat en hel del de senaste åren, med moderna program väsentligt bättre än sina föregångare för att identifiera text.

I själva verket krävde tidig OCR -programvara utbildning programmet på ett specifikt teckensnitt innan det kunde matas in exakt.På samma sätt, vid inmatning av handskrift, måste programmet utbildas, en process som kan vara oerhört tidskrävande.Metoder har emellertid förbättrats och mer intelligenta system är nu normen.Metoderna som används är nu relativt statiska, med bara lite forskning som går till att utveckla helt nya metoder, och de flesta forskning som går till förädling av befintliga förfaranden för att göra dem allt mer exakta.Tidig OCR-programvara användes i ett brett spektrum av applikationer, med stora företag som använde den för att läsa kreditkortsavtryck på 1950-talet, och USAEn bit OCR -programvara var svår, eftersom många program var ganska dåliga vid vissa uppgifter och ganska bra på andra.Idag har emellertid fältet i stort sett utjämnats.Noggrannhetsgraden i någon bra OCR -programvara för att översätta latinska skript som har skrivits är över 99%.När det gäller att mata in handskrift, emellertid, eller mer komplicerade typsnitt, har OCR -programvara fortfarande ett relativt högt intervall.

Kostnaden för OCR -programvara fluktuerar också brett, ofta i förhållande till de noggrannhetsgrader som den har.En hel del gratis OCR -programvara kan hittas som är lämplig för att mata in tryckt material, och vissa kan hittas som är relativt bra på att upptäcka handskrift, särskilt med viss träning.Dyrare mjukvarusviter, till exempel omnipage -sviten, som kostar cirka 100 dollar dollar (USD) för hemversionen och cirka $ 450 USD för den professionella versionen, har imponerande matriser av funktioner och i allmänhet högre framgångsgrader.

Tyvärr finns det fortfarande inget sådant som perfekt OCR -programvara, så att välja ett program att köpa kan fortfarande till stor del vara en frustrerande process.Även de bästa programmen kommer sannolikt att ha en svår tid med handskrift, och fel kommer oundvikligen att krypa igenom, även på låga nivåer.Oftast är det att välja ett program att köpa kommer till extra funktioner: flerspråkigt stöd, en-touch-skanning och konverteringsintegration, automatisk PDF-konvertering och hela ord erkännande över specialiserade discipliner som juridiska och medicinska områden.