컨텐츠로 건너뛰기
검색
머니투데이 언론사 이미지

SKT '에이닷엑스 4.0' 도면도 이해…대규모 문서도 고속학습

머니투데이 윤지혜기자
원문보기

SKT '에이닷엑스 4.0' 도면도 이해…대규모 문서도 고속학습

서울맑음 / -3.9 °
SKT, '에이닷엑스 인코더' 'VL 라이트모델' 오픈소스 공개

에이닷엑스 4.0 VL 라이트 벤치마크 성과. /사진=깃허브

에이닷엑스 4.0 VL 라이트 벤치마크 성과. /사진=깃허브


SK텔레콤의 LLM(거대언어모델) '에이닷엑스 4.0'이 멀티모달 AI로 진화했다. AI가 대규모 데이터를 빠르게 학습할 수 있도록 돕는 범용 문서 해석 기술도 자체 개발했다.

29일 SKT는 △에이닷엑스 인코더(A.X Encoder) △에이닷엑스 4.0 비전 랭기지 라이트(A.X 4.0 VL Light) 2종을 연구·상업 이용이 가능하도록 오픈소스 커뮤니티 허깅페이스에 공개했다.

자연어 처리 기술에서 인코더란 이용자가 입력한 문장 속 모든 단어의 상호관계를 파악해 전체 의미와 맥락을 이해하는 역할이다. 이용자의 프롬프트를 바탕으로 다양한 자연어 처리 작업을 수행하도록 돕는 핵심요소다.

SKT는 에이닷엑스의 데이터 처리 전 과정에 적용하기 위해 에이닷엑스 인코더를 개발했다. 이는 긴 문서를 빠르고 효율적으로 처리해 대규모 LLM 학습에 적합하다는 설명이다. 에이닷엑스 인코더는 1억4900만개(149M) 매개변수를 기반으로 작동한다. 자연어 이해 성능 지표에서 평균 85.47점을 달성해 글로벌 최고수준(SOTA)급 성능을 확인했다. 업스테이지·네이버(NAVER)·KAIST·뉴욕대 등 30여개 기관이 참여한 KLUE 팀의 'RoBerTa-base'의 성능지표(80.19점)를 웃돌았다.

일반적으로 인코더가 512개 토큰을 쓰는 반면 에이닷엑스 인코더는 1만6384개 토큰까지 처리가 가능하다. 덕분에 기존 모델보다 추론속도는 최대 3배, 학습속도는 최대 2배 빠르다. SKT는 LLM에 에이닷엑스 인코더를 적용하면 단순 학습 외에도 다양한 문서 처리 효율이 높아진다고 강조했다.


AI가 도면까지 이해…"똑똑한데 비용도 저렴"

에이닷엑스 4.0 기반의 '에이닷엑스 챗'으로 생성한 4컷만화. /사진=에이닷엑스 챗 캡처

에이닷엑스 4.0 기반의 '에이닷엑스 챗'으로 생성한 4컷만화. /사진=에이닷엑스 챗 캡처


에이닷엑스 4.0 비전 랭기지 라이트는 대규모 멀티모달 한국어 데이터셋을 학습한 시각-언어모델(VLM)이다. 70억개(7B) 매개변수의 '에이닷엑스 4.0 라이트' 모델을 기반으로 개발됐다. 단순 "4컷 만화를 그려줘", "다이어그램을 수정해줘"와 같은 명령어뿐 아니라 표·그래프, 제조 도면도 이해해 기업용 서비스에 적합하다.

이번 모델은 한국어 시각 벤치마크에서 평균 79.4점을 기록했다. 중국 알리바바의 Qwen2.5-VL32B(73.4점)보다 매개변수 규모는 5분의 1수준인데, 우수한 성능을 보인 것이다. 한국어 텍스트 벤치마크에서는 평균 60.2점을 기록, 경량이지만 국내 모델 중 최상위권에 올랐다.


한국어 문화 및 맥락적 이해를 평가하기 위해 설계된 멀티모달 벤치마크인 K-Viscuit에서 80.2점, 복잡한 문서 구조와 차트·표를 이해하는데 중점을 둔 KoBizDoc 벤치마크에서는 89.8점을 달성했다. Qwen2.5-VL32B은 각각 72.3점과 88.8점을 받았다. 무엇보다 Qwen2.5-VL32B 대비 약 41% 적은 토큰을 사용해 비용 효율성이 높다는 설명이다.

SKT는 7월 한 달간 6개 AI 모델을 공개한데 이어 자체 개발한 토크나이저와 인코더도 선보이며 AI 경쟁력을 높였다. 이를 API(응용프로그램인터페이스) 형태로 기업에 제공해 AI B2B(기업간 거래) 사업을 확대한다는 목표다.

김태윤 SK텔레콤 파운데이션 모델 담당은 "독자적인 기술력 확보가 소버린 AI의 핵심인 만큼, 자체 역량을 높이고 컨소시엄 기업들과의 협업에도 박차를 가해 글로벌 최고 수준의 AI 경쟁력을 확보할 것"이라고 밝혔다.

윤지혜 기자 yoonjie@mt.co.kr

Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.