[IT큐레이션] 네이버 AI가 메이드 인 차이나라고? 모호한 프롬 스크래치 가이드 라인 문제 : zum 뉴스

[최진홍 기자] 대한민국 인공지능(AI) 산업의 명운을 가를 정부 주관 독자 AI 파운데이션 모델 프로젝트 심사가 막바지로 치닫는 가운데 유력 후보인 네이버클라우드가 논란에 휘말렸다.

자사 모델에 중국산 핵심 기술을 차용한 사실을 공식 인정했기 때문이다. 그 누구보다 소버린(Sovereign) AI, 즉 기술적 종속 없이 독자적인 AI 주권을 확보하겠다는 의지를 불태웠다는 점에서 파장이 클 수 밖에 없다. 이에 앞서 업스테이지가 비슷한 논란에 휘말린 가운데 네이버 AI를 둘러싼 갑론을박도 커질 전망이다.

중국산 부품 썼지만 두뇌는 국산... 네이버의 '전략적 호환성' 승부수

사건의 발단은 최근 네이버클라우드가 정부 프로젝트에 제출한 멀티모달 AI 모델 '하이퍼클로바X 시드 32B 싱크'의 성능 검증 과정에서 불거졌다. 7일 정보통신기술(ICT) 업계에 따르면 네이버의 해당 모델은 중국 알리바바가 개발한 큐웬(Qwen) 2.5 모델의 비전 인코더와 코사인 유사도 및 피어슨 상관계수에서 높은 일치율을 보인 것으로 드러났다.

네이버 모델이 시각 정보를 처리하는 과정에서 중국 모델의 가중치(Weight)를 상당 부분 그대로 가져다 썼음을 의미하는 데이터다.

다만 네이버는 심각한 문제가 아니라는 입장이다. 자사 멀티모달 AI 모델에 차용한 중국 비전 인코더는 언제든 자체 개발한 모델로 교체할 수 있다는 설명이다.

네이버 측의 해명을 종합하면 AI 파운데이션 모델의 핵심인 사고와 추론을 담당하는 거대언어모델(LLM) 즉 '두뇌'는 100% 자체 기술로 개발한 '프롬 스크래치(From Scratch)' 모델이 맞다. 다만 눈과 귀 역할을 하여 시각 정보를 뇌로 전달하는 시신경에 해당하는 비전 인코더는 글로벌 생태계와의 호환성과 시스템 최적화를 위해 이미 성능이 검증된 큐웬의 오픈소스를 전략적으로 채택했다는 것이다.

기술력 부족 때문이 아니라는 입장인 것으로 알려졌다. 네이버클라우드는 이미 'VUClip'과 같은 독자적인 비전 인코더 기술력을 보유하고 있기 때문이다.

글로벌 빅테크 기업들 역시 구글이나 오픈AI의 특정 모듈을 오픈소스로 활용해 생태계를 확장하는 것이 일반적인 관행이다. 나아가 독자 AI 파운데이션 모델의 본질은 모든 부품을 처음부터 끝까지 직접 만드는 것이 아니라 전체 아키텍처에 대한 통제권을 갖고 한국어와 한국 사회의 맥락을 이해하는 독창적인 시스템을 구축하는 데 있다는 것이 네이버의 논리다.

흔들리는 '프롬 스크래치' 정의와 기술 종속의 딜레마

쟁점은 정부와 업계가 표방해 온 '프롬 스크래치'의 정의와 범위에 있다.

프롬 스크래치는 데이터 수집부터 모델 설계 학습까지 전 과정을 백지상태에서 자체 수행하는 방식을 뜻한다. 정부는 이번 프로젝트의 핵심 평가 요소로 이 프롬 스크래치 방식을 제시하며 외산 기술에 의존하지 않는 완전한 기술 자립을 요구해왔다.

일부 AI 개발자들은 네이버가 비전 인코더의 역할을 지나치게 축소하고 있다고 반박한다. 멀티모달 AI 시대에 비전 인코더는 단순히 이미지를 디지털 신호로 바꾸는 변환기가 아니라 시각 정보의 맥락을 이해하고 이를 언어 모델과 연결하는 '제2의 두뇌'에 가까운 역할을 수행하기 때문이다.

실제로 하이퍼클로바X 모델과 큐웬 모델의 가중치 유사도가 99% 이상이라는 분석 결과는 네이버 모델의 시각적 지능이 사실상 중국 기술에 빚지고 있음을 시사한다. 업계 한 관계자는 "비전 인코더는 전체 파라미터의 10% 이상을 차지할 정도로 중요한 모듈"이라며 "핵심 인지 기능을 중국 오픈소스에 의존한다면 향후 중국 측이 라이선스 정책을 변경하거나 사용을 불허할 경우 한국의 AI 서비스가 멈춰 설 수 있는 치명적인 리스크를 안게 된다"고 지적했다.

이는 앞서 유사한 표절 의혹을 겪었던 업스테이지 사례와 맞물려 형평성 논란으로까지 번지고 있다.

업스테이지는 지난 1일 자사 모델이 중국 모델을 베꼈다는 의혹에 대해 공개 검증을 실시하며 결백을 입증했고 의혹 제기자의 사과를 받아내며 논란을 불식시켰다. 반면 네이버는 차용 사실을 스스로 인정한 만큼 상황이 다르다는 말이 나온다.

실제로 경쟁사들은 이날 정부 관계자가 참석한 회의에서 네이버의 큐웬 차용 문제를 공식적으로 제기하며 공정한 평가를 촉구한 것으로 알려졌다. 소버린 AI의 취지가 국가 안보와 직결된 기술 주권 확보에 있는 만큼 효율성을 이유로 타국 기술을 핵심 부품으로 사용하는 것은 사업의 근간을 흔드는 행위라는 비판이다.

모호한 정부 가이드라인이 키운 혼란... 15일 운명의 시간

사태의 근본적인 원인은 평가 주체인 정부의 모호한 기준에 있다는 지적도 나온다. 실제로 과학기술정보통신부는 지난해 사업 공고 당시 해외 모델의 파인튜닝(미세조정)을 통한 파생 모델은 인정하지 않는다고 명시했으나 인코더와 같은 하위 모듈의 차용 허용 범위나 '프롬 스크래치'의 구체적인 기술적 가이드라인은 제시하지 않았다.

이로 인해 기업들은 각자의 해석에 따라 개발을 진행했고 결과적으로 심사 막판에 이르러서야 기술적 정체성을 둘러싼 진실 공방이 벌어지게 된 것이다. 네이버 입장에서는 경계가 명확하지 않은 규칙의 적용 여부를 두고 다소 억울한 상황에 빠진 것 아니냐는 말도 나온다.

한편 정부는 네이버클라우드를 비롯해 업스테이지 SK텔레콤 NC AI LG AI연구원 등 5개 컨소시엄을 대상으로 심사를 진행 중이며 오는 15일까지 평가를 마치고 최종 지원 대상을 선정할 예정이다.

정부 관계자는 "현재 평가 기간 중으로 심사위원들이 독창성을 포함한 평가 항목을 면밀히 들여다보고 있다"며 원론적인 입장을 고수하고 있다. 하지만 네이버가 "교체 여부와 시점은 아직 결정되지 않았다"며 공을 정부의 판단으로 넘긴 상황에서 정부의 최종 결정은 향후 한국형 AI 모델의 개발 방향성과 기술 자립도의 기준을 정립하는 중요한 판례가 될 전망이다.

<저작권자 Copyright ⓒ ER 이코노믹리뷰 무단전재 및 재배포 금지>

이 기사의 카테고리는 언론사의 분류를 따릅니다.