OCR은 다양한산업과 일상에서 사용됩니다
행정/기업: 종이 문서를 디지털화해서 검색 가능하게 만듦 (예: 주민등록등본, 계약서).
금융/보험: 통장 사본, 청구서, 영수증에서 정보 추출.
의료: 진단서, 처방전 정보 추출.
교육/연구: 논문 스캔본을 텍스트로 변환해서 분석.
모바일 앱: 명함 스캔, 문자인식 번역기, 영수증 정리 등
딥러닝기술의 발전으로 인한 변화
예전에는 단순한 규칙 기반 OCR이 대부분이라 글꼴, 배경, 기울기에민감했습니다
지금은 CNN, Transformer 같은 딥러닝 기반 모델 덕분에:
손글씨, 다양한 글꼴, 기울어진 텍스트도 잘 인식 배경 노이즈나 이미지 품질이 낮아도 비교적 정확히 인식
한국어, 일본어 같은 비영어권 언어도 더 잘 인식가능해졋습니다
정확도높은 OCR프로그램
ABBYY FineReader
Google Cloud Vision API
한국어OCR이 어려운이유
문자 수가 많고 조합이 복잡함 (초성-중성-종성 조합)
띄어쓰기 오류 등으로 문맥 파악이 어려움
OCR로 그래프도 인식할수있는가
그래프를 인식하려면 Chart/Graph Recognition이라는 별도 기술이 필요
요즘은 그래프 이미지에서 데이터를 추출하는 AI 도구들도 나왔습니다
PlotDigitizer, WebPlotDigitizer