Skip to main content

OCR (광학 문자 인식)이란 무엇입니까?

OCR (광학 문자 인식)은 인쇄 된 자료를 텍스트 또는 워드 프로세싱 파일로 변환하는 프로세스로 쉽게 편집하고 저장할 수있는 프로세스입니다.이 기술은 이러한 재료가 하드 카피 재료보다 훨씬 적은 저장 공간을 사용하여 저장할 수있게 해주었다.OCR 기술은 정보를 저장, 공유 및 편집하는 방식에 큰 영향을 미쳤습니다.광학 문자 인식 전에 누군가 책을 단어 처리 파일로 바꾸고 싶다면 각 페이지가 단어를 입력해야합니다.

OCR 기술에는 하드웨어와 소프트웨어가 모두 필요합니다.또한 정교한 OCR 시스템에는 프로세스를 완료하기 위해 컴퓨터 자체의 추가 회로 보드가 필요합니다.광학 스캐너는 페이지에서 텍스트를 스캔 한 다음 글꼴을 비트 맵이라는 일련의 도트로 나눕니다.이 소프트웨어는 가장 일반적인 글꼴을 읽고 라인이 시작하고 중지되는 위치를 구별 할 수 있습니다.이 비트 맵은 컴퓨터 텍스트로 변환됩니다.

광학 문자 인식이 최근 몇 년 동안 큰 발전을 이루었지만 필기와 유사한 필기 또는 글꼴을 인식하는 데 여전히 잘 작동하는 것은 아닙니다.은행 업계에는 OCR 기술을 사용하여 손으로 쓴 수표의 금액을 읽고, 라우팅 및 계정 번호를 읽을 수있는 컴퓨터 능력과 함께 진행하는 시스템이 있습니다.실제 예를 살펴 보는 데 도움이 될 수 있습니다.모든 범죄 기록이 광대 한 파일 캐비닛에 저장된 경찰서를 상상해보십시오.수백만 페이지를 스캔하는 것은 비싸고 시간이 많이 걸리는 사업 일지 모르지만, 혜택은 엄청납니다.

일단 OCR 시스템이 페이지를 컴퓨터로 읽을 수있는 텍스트로 변환 한 후에는 탐정이 전체 기록을 통해 전체 기록을 검색 할 수 있습니다.몇 초.수동으로 특정 기록을 찾는 것은 그리 어렵지 않을 수 있지만, 형사가 8:00에서 8:30 사이의 특정 교차로에 저지른 모든 범죄를 찾으려고한다고 상상해보십시오.이 예제는 검색 가능한 텍스트의 힘의 표면을 긁어 내며, 많은 회사와 기관이 레거시 데이터를 OCR에 수백만 달러를 소비하는 이유는 하나 일뿐입니다.