옴니모달 하이퍼클로바X 이미지 |
한국 독자 파운데이션 AI 모델 1차 심사를 앞두고 '프롬 스크래치(AI 모델을 처음부터 모두 직접 설계·학습하는 방식)' 논란이 이어지고 있다. 앞서 업스테이지에 이어 이번에는 네이버(NAVER)다. 네이버가 중국산 모델을 베꼈다는 지적이다. 이와 관련 네이버는 "AI 모델에서 가장 핵심적인 기반은 자체 기술로 개발했다"는 입장을 내놓으며 '프롬 스크래치' 관련 "명확한 기준이 필요하다"고 했다.
7일 IT 업계에 따르면 최근 세계 최대 오픈소스 플랫폼인 깃허브에 '국가 AI 파운데이션 모델 프롬 스크래치 검증 프로젝트'라는 보고서가 올라오면서 네이버가 독자 기술로 AI 모델을 개발한 것이 아니라는 의혹이 불거졌다.
해당 리포트는 국가 대표 AI 파운데이션 모델 중 4개 모델은 프롬 스크래치이고, 네이버클라우드만 아니라고 주장했다. 네이버가 '비전 인코더'라는 핵심 모듈을 중국 알리바바의 AI '큐엔(Qwen) 2.5 ViT'를 가져다 썼고 따라서 프롬 스크래치가 아닌 '부분적 재사용'이라고 판단한 것이다.
비전 인코더는 사진과 음성 등을 AI가 이해할 수 있도록 디지털 신호로 바꿔주는 장치로, AI의 눈과 귀 역할이다. 지적은 타 AI 업체에서도 잇따랐다.
이 같은 지적에 네이버클라우드는 문제의 인코더가 상호 호환되는 영역으로, 오픈소스로 돼 있는 것을 빌려 썼다고 해서 프롬스크래치가 아니라는 지적은 옳지 않다고 반박했다.
네이버 관계자는 "핵심은 '무엇이 진정한 기반인가'에 대한 관점"이라며 "AI 모델에서 가장 핵심적인 기반은 사고와 추론을 담당하는 파운데이션 모델 자체이며, 이 부분은 100% 자체 기술로 개발했다"고 밝혔다. 특히 한국어와 한국 사회의 복잡한 맥락을 이해하는 능력은 외부 기술로 대체할 수 없는 영역이어서 여기에 핵심 역량을 집중했다는 설명이다.
문제의 인코더 관련해서도 "입력 신호를 변환하는 범용 모듈로서, 글로벌 생태계에서 이미 표준화돼 있고 상호 호환되는 영역"이라며 "이 부분까지 모두 자체 개발하는 것이 프롬 스크래치 필수 조건인지에 대해서는 다양한 관점이 존재하고, 정부와 업계가 명확한 기준을 정립할 필요가 있다"고 강조했다.
아울러 AI 모델은 데이터, 아키텍처, 학습 알고리즘, 인코더 등 다양한 층위로 구성된 만큼 어디까지를 자체 개발해야 하는지 생산적인 논의를 할 필요가 있다고 덧붙였다.
김소연 기자 nicksy@mt.co.kr
Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
