Skip to main content

Che cos'è OCR (riconoscimento ottico del personaggio)?

Il riconoscimento ottico dei caratteri (OCR) è un processo di conversione di materiali stampati in file di testo o di elaborazione testi che possono essere facilmente modificati e archiviati.La tecnologia ha consentito di memorizzare tali materiali utilizzando molto meno spazio di archiviazione rispetto ai materiali cartacei.La tecnologia OCR ha avuto un impatto enorme sul modo in cui le informazioni vengono archiviate, condivise e modificate.Prima del riconoscimento ottico dei personaggi, se qualcuno voleva trasformare un libro in un file di elaborazione di testi, ogni pagina dovrebbe essere digitata Word per Word. La tecnologia OCR richiede sia hardware che software.Inoltre, i sofisticati sistemi OCR richiedono un circuito aggiuntivo nel computer stesso per completare il processo.Uno scanner ottico scansiona il testo su una pagina, quindi rompe i caratteri in una serie di punti chiamati Bitmap.Il software può leggere i caratteri più comuni e distinguere dove le linee iniziano e si fermano.Questa bitmap viene quindi tradotta in testo del computer.

Mentre il riconoscimento ottico dei personaggi ha fatto enormi progressi negli ultimi anni, non si comporta sempre bene nel riconoscere la calligrafia o i caratteri che sembrano simili alla calligrafia.Esistono sistemi nel settore bancario che utilizzano la tecnologia OCR per cercare di leggere gli importi su controlli scritti a mano, per seguire la capacità dei computer di leggere il routing e i numeri di conto.

per dare un'idea del potere di OCR,Può aiutare a dare un'occhiata a un esempio del mondo reale.Immagina un dipartimento di polizia che ha archiviato tutti i suoi casellari penali in vasti archivi.Sebbene la scansione di milioni di pagine sarebbe un'impresa costosa e che richiede tempo, i vantaggi sono enormi.

Una volta che il sistema OCR ha convertito le pagine in testo leggibile da computer, un detective, ad esempio, potrebbe cercare l'intera storia in unpochi secondi.Trovare manualmente un record particolare potrebbe non essere troppo difficile, ma immagina un detective che cerca di cercare tutti i crimini commessi su un certo incrocio tra le 8:00 e le 8:30.Questo esempio graffia solo la superficie del potere del testo ricercabile, ed è solo uno dei motivi per cui molte aziende e istituzioni spendono milioni di dollari per OCR i loro dati legacy.