Skip to main content

Qu'est-ce que l'OCR (reconnaissance des caractères optiques)?

La reconnaissance optique des caractères (OCR) est un processus de conversion des matériaux imprimés en fichiers de texte ou de traitement de texte qui peuvent être facilement modifiés et stockés.La technologie a permis de stocker ces matériaux en utilisant beaucoup moins d'espace de stockage que les matériaux de copie papier.La technologie OCR a eu un impact énorme sur la façon dont les informations sont stockées, partagées et éditées.Avant la reconnaissance optique des caractères, si quelqu'un voulait transformer un livre en fichier de traitement de texte, chaque page devrait être dactylographiée pour mot.

La technologie OCR nécessite à la fois du matériel et des logiciels.De plus, les systèmes OCR sophistiqués nécessitent une carte de circuit imprimé supplémentaire dans l'ordinateur lui-même pour terminer le processus.Un scanner optique scanne le texte sur une page, puis décompose les polices en une série de points appelés bitmap.Le logiciel peut lire les polices les plus courantes et distinguer où les lignes commencent et s'arrêtent.Ce bitmap est ensuite traduit en texte de l'ordinateur.

Bien que la reconnaissance optique des caractères ait fait d'énormes avancées ces dernières années, elle ne fonctionne toujours pas toujours dans la reconnaissance de l'écriture ou des polices qui ressemblent à l'écriture manuscrite.Il existe des systèmes dans le secteur bancaire qui utilisent la technologie OCR pour essayer de lire les montants sur des chèques manuscrits, pour accompagner la capacité des ordinateurs à lire les numéros de routage et de compte.

pour donner une idée de la puissance de l'OCR,Il peut être utile de jeter un œil à un exemple réel.Imaginez un service de police qui a tous ses casiers judiciaires stockés dans de vastes classeurs.Bien que la numérisation des millions de pages serait une entreprise coûteuse et longue, les avantages sont énormes. Une fois que le système OCR a converti les pages en texte lisible par ordinateur, un détective, par exemple, pourrait rechercher dans toute l'historique dans unequelques secondes.Trouver manuellement un dossier particulier n'est peut-être pas trop difficile, mais imaginez un détective essayant de rechercher tous les crimes commis sur une certaine intersection entre 8h00 et 8h30.Cet exemple ne fait que gratter la surface de la puissance du texte consultable, et ce n'est qu'une des raisons pour lesquelles de nombreuses entreprises et institutions dépensent des millions de dollars pour OCR leurs données héritées.