Skip to main content

Was ist OCR (optische Charaktererkennung)?

Optical Character Recognition (OCR) ist ein Prozess, in dem gedruckte Materialien in Text- oder Textverarbeitungsdateien konvertiert werden können, die leicht bearbeitet und gespeichert werden können.Die Technologie hat ermöglicht, dass solche Materialien mit viel weniger Speicherplatz als die Hardcopy -Materialien gespeichert werden.Die OCR -Technologie hat einen großen Einfluss auf die Art und Weise, wie Informationen gespeichert, geteilt und bearbeitet werden.Vor der optischen Charaktererkennung müsste jemand, der ein Buch in eine Textverarbeitungsdatei verwandeln wollte, jede Seite für Word eingetragen werden.

OCR -Technologie erfordert sowohl Hardware als auch Software.Darüber hinaus erfordern anspruchsvolle OCR -Systeme eine zusätzliche Leiterplatte im Computer selbst, um den Prozess abzuschließen.Ein optischer Scanner scannt den Text auf einer Seite und unterteilt dann die Schriftarten in eine Reihe von Punkten, die als Bitmap bezeichnet werden.Die Software kann die meisten gebräuchlichen Schriftarten lesen und unterscheiden, wo die Linien beginnen und stoppen.Diese Bitmap wird dann in Computertext übersetzt.

Während die optische Charaktererkennung in den letzten Jahren große Fortschritte erzielt hat, funktioniert sie immer noch nicht immer gut darin, Handschrift oder Schriftarten zu erkennen, die der Handschrift ähnlich aussehen.Es gibt Systeme in der Bankbranche, die die OCR-Technologie verwenden, um zu versuchen, die Beträge von handgeschriebenen Schecks zu lesen, um mit den Computern die Fähigkeit zur Verfügung zu stellen, die Routing- und Kontonummern zu lesen.Es kann helfen, sich ein Beispiel in der realen Welt zu werfen.Stellen Sie sich eine Polizeibehörde vor, in der alle Strafregister in riesigen Aktenkabinen gespeichert sind.Obwohl das Scannen von Millionen von Seiten ein teures und zeitaufwändiges Unterfangen wäre, sind die Vorteile groß.ein paar Sekunden.Manuelles Finden eines bestimmten Datensatzes ist möglicherweise nicht zu schwierig, aber stellen Sie sich vor, ein Detektiv, der versucht, nach allen Verbrechen zu suchen, die an einer bestimmten Kreuzung zwischen 8:00 und 8:30 Uhr begangen werden.Dieses Beispiel kratzt nur die Oberfläche der Leistung durchsuchbarer Text, und es ist nur ein Grund, dass viele Unternehmen und Institutionen Millionen von Dollar ausgeben, um ihre Legacy -Daten zu übertreffen.