Skip to main content

Apa itu OCR (pengenalan karakter optik)?

Optical Character Recognition (OCR) adalah proses mengubah materi cetak menjadi file teks atau pengolah kata yang dapat dengan mudah diedit dan disimpan.Teknologi ini telah memungkinkan bahan tersebut disimpan menggunakan ruang penyimpanan yang jauh lebih sedikit daripada bahan hard copy.Teknologi OCR telah membuat dampak besar pada cara informasi disimpan, dibagikan, dan diedit.Sebelum pengenalan karakter optik, jika seseorang ingin mengubah buku menjadi file pengolah kata, setiap halaman harus diketik kata demi kata.

Teknologi OCR membutuhkan perangkat keras dan perangkat lunak.Selain itu, sistem OCR yang canggih membutuhkan papan sirkuit tambahan di komputer itu sendiri untuk menyelesaikan proses.Pemindai optik memindai teks pada halaman, kemudian memecah font menjadi serangkaian titik yang disebut bitmap.Perangkat lunak dapat membaca font yang paling umum dan membedakan di mana garis dimulai dan berhenti.Bitmap ini kemudian diterjemahkan ke dalam teks komputer.

Sementara pengenalan karakter optik telah membuat kemajuan besar dalam beberapa tahun terakhir, itu masih tidak selalu berkinerja baik dalam mengenali tulisan tangan atau font yang terlihat mirip dengan tulisan tangan.Ada sistem dalam industri perbankan yang menggunakan teknologi OCR untuk mencoba membaca jumlah cek yang ditulis tangan, untuk mengikuti kemampuan komputer untuk membaca routing dan nomor akun.

untuk memberikan gambaran tentang kekuatan OCR,Ini dapat membantu untuk melihat contoh dunia nyata.Bayangkan sebuah departemen kepolisian yang memiliki semua catatan kriminalnya disimpan di lemari arsip yang luas.Meskipun pemindaian jutaan halaman akan menjadi pekerjaan yang mahal dan memakan waktu, manfaatnya sangat besar.

Setelah sistem OCR telah mengubah halaman menjadi teks yang dapat dibaca komputer, seorang detektif, misalnya, dapat mencari melalui seluruh sejarah dalam aBeberapa detik.Menemukan catatan tertentu secara manual mungkin tidak terlalu sulit, tetapi bayangkan seorang detektif yang mencoba mencari semua kejahatan yang dilakukan pada persimpangan tertentu antara 8:00 dan 8:30.Contoh ini hanya menggaruk permukaan kekuatan teks yang dapat dicari, dan itu hanya salah satu alasan bahwa banyak perusahaan dan institusi menghabiskan jutaan dolar untuk mengesampingkan data warisan mereka.