챗GPT에 활용된 이파피루스 '파이뮤PDF |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
이파피루스는 올해 1분기 글로벌 고객 문의 중 65%가 인공지능(AI) 특화 문서 데이터 기술 내용이었다고 15일 밝혔다.
이는 전년 동기 대비 2배 증가한 수치다. 지난해 말 오픈AI 인공지능 챗봇 '챗GPT'에 학습 및 문서 처리 서비스를 위한 PDF 기술을 공급하면서 효과적인 브랜딩이 이뤄졌다는 게 회사 측 설명이다.
김정희 이파피루스 대표는 “텍스트 데이터를 인공지능이 이해할 수 있는 형태로 추출하는 기술은 LLM(Large Language Moelds)이나 RAG(Retrieval Augmented Generation)와 같은 자연어 처리 모델 훈련 및 활용에 필수적”이라며 “과거엔 텍스트 추출 기술이 소수 LLM 훈련 기업에만 수요가 있었다면 최근에는 LLM을 직접 활용하길 원하는 일반 기업도 늘어나며, 관련 기술 수요가 늘었다”고 말했다.
이파피루스는 수요 증가에 맞게 핵심 기술인 'LLM특화 텍스트 추출'로 사업을 확장할 계획이다. LLM 추출은 PDF 문서에서 안정적으로 텍스트를 추출하는 기술이다.
추출 내용 정확도와 문서를 학습할 때 소모되는 LLM 토큰 사용도 최소화한다. LLM 학습에 필요한 메타 데이터를 효과적으로 생성한다.
회사 관계자는 “본사는 PDF 처리 기술 '파이뮤PDF(PyMuPDF)'를 기반으로 텍스트 추출 분야에서 독보적인 위치를 차지하고 있다”며 “AI 기술 발전과 활용에 있어 중추적인 역할을 수행해온 만큼, 변화하는 시장에서 리딩 컴퍼니로 도약할 것”이라고 했다.
회사는 문서 AI 기술 전문 기업이다. 여러 언어 모델과 데이터 추출 기술을 개발했다. AI 훈련 및 활용에 필수적인 솔루션을 제공한다. 미국 및 유럽, 일본 등에 해외 자회사를 통해 글로벌 사업을 전개 중이다. 전체 매출 절반이 해외 고객이다.
임중권 기자 lim9181@etnews.com
[Copyright © 전자신문. 무단전재-재배포금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.