정의
텍스트 인식은 이미지나 스캔한 문서에 있는 텍스트 문자를 식별하는 것을 말합니다. 여기에는 인쇄된 텍스트와 필기체 인식이 포함됩니다.
목적
목적은 시각적 형식의 텍스트를 접근하고 검색할 수 있도록 만드는 것입니다.
중요성
- 기록 보관소의 디지털화가 가능합니다.
- 접근성과 자동화에 중요합니다.
- 정확도는 이미지 품질에 따라 달라집니다.
- OCR 기술과 관련이 있습니다.
작동 원리
- 스캔하거나 사진으로 찍은 문서를 캡처합니다.
- 선명도를 높이기 위해 이미지를 사전 처리합니다.
- 텍스트 영역을 감지합니다.
- 인식 모델을 적용합니다.
- 기계가 읽을 수 있는 텍스트를 출력합니다.
예시(실제 세계)
- Google 렌즈: 사진 속의 텍스트를 인식합니다.
- ABBYY FineReader: 스캔한 문서를 디지털화합니다.
- Tesseract OCR: 오픈소스 텍스트 인식 엔진.
참고문헌 / 추가 자료
- Smith, R. “Tesseract OCR 엔진 개요.” ICDAR.
- ISO/IEC 15938-4 표준.
- IEEE 패턴 분석 및 머신 인텔리전스 저널.