Skip to main content

OCR (การจดจำอักขระออพติคอล) คืออะไร?

การจดจำอักขระออปติคอล (OCR) เป็นกระบวนการของการแปลงวัสดุที่พิมพ์เป็นไฟล์ข้อความหรือการประมวลผลคำที่สามารถแก้ไขและจัดเก็บได้อย่างง่ายดายเทคโนโลยีได้เปิดใช้งานวัสดุดังกล่าวที่จะจัดเก็บโดยใช้พื้นที่จัดเก็บน้อยกว่าวัสดุสำเนายากเทคโนโลยี OCR ได้สร้างผลกระทบอย่างมากต่อวิธีการจัดเก็บข้อมูลแบ่งปันและแก้ไขก่อนการจดจำอักขระแบบออพติคอลหากมีคนต้องการเปลี่ยนหนังสือให้เป็นไฟล์ประมวลผลคำแต่ละหน้าจะต้องพิมพ์คำสำหรับ Word

เทคโนโลยี OCR ต้องใช้ทั้งฮาร์ดแวร์และซอฟต์แวร์นอกจากนี้ระบบ OCR ที่ซับซ้อนต้องใช้แผงวงจรเพิ่มเติมในคอมพิวเตอร์เพื่อให้กระบวนการเสร็จสมบูรณ์สแกนเนอร์ออปติคัลสแกนข้อความบนหน้าหนึ่งจากนั้นแบ่งตัวอักษรลงเป็นชุดของจุดที่เรียกว่าบิตแมปซอฟต์แวร์สามารถอ่านแบบอักษรที่พบบ่อยที่สุดและแยกแยะว่าเส้นเริ่มต้นและหยุดบิตแมปนี้จะถูกแปลเป็นข้อความคอมพิวเตอร์

ในขณะที่การจดจำตัวละครแบบออพติคอลได้สร้างความก้าวหน้าอย่างมากในช่วงไม่กี่ปีที่ผ่านมามีระบบภายในอุตสาหกรรมการธนาคารที่ใช้เทคโนโลยี OCR เพื่อพยายามอ่านจำนวนเงินในการตรวจสอบที่เขียนด้วยมือเพื่อไปพร้อมกับความสามารถของคอมพิวเตอร์ในการอ่านการกำหนดเส้นทางและหมายเลขบัญชี

เพื่อให้เข้าใจพลังของ OCRมันสามารถช่วยดูตัวอย่างในโลกแห่งความจริงลองนึกภาพกรมตำรวจที่มีบันทึกทางอาญาทั้งหมดที่เก็บไว้ในตู้เก็บเอกสารจำนวนมากแม้ว่าการสแกนหน้าหลายล้านหน้าจะมีราคาแพงและใช้เวลานาน แต่ผลประโยชน์ก็มีขนาดใหญ่

ไม่กี่วินาที.การหาบันทึกโดยเฉพาะอย่างนี้อาจไม่ยากเกินไป แต่ลองนึกภาพนักสืบที่พยายามค้นหาอาชญากรรมทั้งหมดที่เกิดขึ้นบนสี่แยกระหว่าง 8:00 น. ถึง 8:30ตัวอย่างนี้มีเพียงรอยขีดข่วนพื้นผิวของพลังของข้อความที่ค้นหาได้และเป็นเพียงเหตุผลเดียวที่ บริษัท และสถาบันหลายแห่งใช้จ่ายเงินหลายล้านดอลลาร์เพื่อ OCR ข้อมูลดั้งเดิมของพวกเขา