‘국가대표 AI’를 개발하겠다는 정부의 ‘독자 AI 파운데이션’ 사업이 논란에 휩싸였다. 네이버가 중국 알리바바의 인공지능(AI) 모델 ‘큐웬(Qwen)’의 이미지와 음성 인코더를 차용했다고 인정한 가운데 경쟁 기업에서 평가 기관측에 이에 대해 공식 문제제기를 한 것으로 확인됐다.
7일 정보기술(IT) 업계에 따르면 독자 AI파운데이션 선발전에 참여중인 5개 정예팀 중 1곳이 평가 기관으로 참여 중인 한국정보통신기술협회(TTA)에 기술 검토 보고서를 제출했다. 네이버가 공개한 ‘하이퍼클로바X-띵크-32B·옴니-8B’ 모델에 활용된 이미지·음성 인코더가 알리바바 ‘큐웬 2.5 ViT’의 것을 차용한 데 따른 것이다.
동아일보가 입수한 이 보고서에는 “(최신 연구들에 따르면) 인코더는 단순 부품이 아닌 핵심 지능 모듈”이라며 “비전(시각) 인코더의 품질은 멀티모달 대형언어모델(MLLM) 최종 성능의 상한선을 결정한다”고 지적했다. 또 “외부 인코더에 의존하는 모델은 지각적 특징 추출 단계부터 타사 아키텍처에 종속된다”며 “진정한 의미의 AI 주권 확보를 불가능하게 한다”고 지적했다.
인코더는 입력되는 이미지나 음성 데이터를 AI가 활용하는 숫자 데이터로 변환해주는 기능으로 AI의 ‘눈과 귀’에 비유된다. ‘중국산 인코더’ 논란에 네이버는 “검증된 인코더를 쓰는 것은 업계의 일반적인 방식”이라며 ‘두뇌’에 해당하는 파운데이션 모델은 자체 기술로 개발했기 때문에 독자성에는 문제가 없다는 입장이다.
하지만 업계에서는 “향후 라이센스 문제가 발생할 수 있다”는 우려의 목소리도 나온다. 국내의 한 AI 전문가는 오픈소스라도 정확한 라이선스 조건을 확인해야 하고 나중에 오픈소스를 제공한 측에서 비용을 요구할 가능성도 있다“고 했다.
정부도 지난해 7월 사업 공고 당시 독자 AI파운데이션을 두고 “해외 모델 미세조정(파인튜닝) 등으로 개발한 파생형 모델이 아닌 모델의 설계부터 사전학습 과정 등을 수행한 국산 모델(타사 모델에 대한 라이센싱 이슈 부재)”라는 조건을 달기도 했다.
최지원 기자 jwchoi@donga.com
Copyright Ⓒ 동아일보. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
