컨텐츠로 건너뛰기
검색
한국일보 언론사 이미지

손상된 고문헌, AI 이용 복원해 데이터로 변환

한국일보
원문보기

손상된 고문헌, AI 이용 복원해 데이터로 변환

서울맑음 / -3.9 °
[2025 우수특허대상] 나라지식정보


AI 데이터 솔루션 전문 기업인 나라지식정보(대표 손영호)는 CRF 기반 고문서 AI 해독기술 ‘NARA OCR’을 개발해 문화유산 디지털화와 문서 인식 분야를 선도하고 있다. NARA OCR은 XAI 구현을 위한 원천기술이자 데이터 전처리 자동화의 핵심 기술로 주목받고 있다.

이 특허 기술은 손상된 고문헌 복원, 문자 인식, 정렬, 문장·구절 경계 식별을 한 번에 수행하여 비정형 옛 문서를 구조화된 데이터로 변환한다. 인식 결과는 Hidden Text PDF로 제공되어 원본 이미지의 시각적 진본성을 유지하면서도 텍스트 검색과 복사가 가능하다. 별도 데이터 변환 없이 RAG DB와 연동되며, LLM 등 AI 서비스에도 바로 활용 가능하다.

NARA OCR 기술의 혁신성은 국내외에서 인정받고 있다. 올해 베이징에서 열린 국제 디지털인문학 학술대회에서 ‘근대 시기 문서 다국어 OCR 개발’ 연구가 우수 연구로 선정되었다.

또한 올해 AI 챔피언십에서 초거대언어모델 ‘주춧돌LM’이 한국정보통신기술협회상을 받으며 AI 분야 경쟁력을 입증했다.