에스에이티정보의 R2-TA 패키지. |
에스에이티정보(대표 오세용)가 인공지능(AI) 활용에 걸림돌로 지적받아 온 공공기관 한글(HWP) 문서를 기계 학습 가능한 데이터로 변환하는 솔루션을 앞세워 공공 시장 공략에 속도를 낸다.
에스에이티정보는 자사의 전자문서 데이터 전처리 솔루션 'R2'를 통해 비정형 한글 문서를 AI가 이해할 수 있는 정형 데이터로 재구성, 공공 AI 행정 지원에 나선다고 23일 밝혔다.
최근 정부의 AI 업무보고 등에서 공직사회 보고서가 AI 분석에 부적합하다는 지적이 잇따르고 있다. 공공기관 표준인 한글(HWP) 문서는 텍스트, 표, 이미지가 혼합된 비정형 구조로 되어 있어, 사람이 보기엔 편하지만 AI가 데이터를 학습하고 의미를 파악하는 데는 기술적 한계가 뚜렷했다.
에스에이티정보의 'R2'는 단순한 파일 형식 변환을 넘어 문서의 구조적 한계를 해결하는 데 초점을 맞췄다. 이 솔루션은 △문서 내 본문·제목·표·목차·주석 등 구조 정밀 분석 △의미 단위 텍스트 추출 △데이터 정형화 과정을 수행한다.
이를 통해 공공기관은 기존에 축적된 방대한 보고서와 행정 문서를 별도로 재작성할 필요 없이 즉시 AI 학습, 요약, 지능형 검색 등에 활용할 수 있다. 회사 측은 이를 통해 데이터 기반의 과학적 행정 구현과 업무 효율성이 대폭 개선될 것으로 기대하고 있다.
에스에이티정보 관계자는 “공공 AI의 성패는 기존 문서 자산을 얼마나 효과적으로 데이터화하느냐에 달려있다”며 “R2를 통해 공공문서를 AI가 활용 가능한 데이터 자산으로 전환하는 데 주력하겠다”고 말했다.
김현민 기자 minkim@etnews.com
[Copyright © 전자신문. 무단전재-재배포금지]
