컨텐츠로 건너뛰기
검색
디지털투데이 언론사 이미지

독파모 흔든 '프롬 스크래치' 논쟁...2차 평가서도 핵심 잣대로 부상

디지털투데이
원문보기

독파모 흔든 '프롬 스크래치' 논쟁...2차 평가서도 핵심 잣대로 부상

서울맑음 / -3.9 °
[이진호 기자]
류제명 과학기술정보통신부 2차관이 지난 15일 서울 종로구 정부서울청사에서 독자AI 파운데이션 모델 프로젝트 1차 단계평가 결과를 발표하고 있다. [사진: 과기정통부]

류제명 과학기술정보통신부 2차관이 지난 15일 서울 종로구 정부서울청사에서 독자AI 파운데이션 모델 프로젝트 1차 단계평가 결과를 발표하고 있다. [사진: 과기정통부]


[디지털투데이 이진호 기자] 정부가 추진하는 '독자 AI' 파운데이션 모델'(이하 독파모) 1차 평가에서 네이버클라우드가 탈락하는 이변이 일어났다. 모델 독자성을 가늠하는 '프롬 스크래치(From Scratch)' 여부가 당락을 갈랐다. 업계는 앞으로의 평가에서도 독자성이 핵심 잣대가 될 것으로 보고 촉각을 곤두세우고 있다.

◆평가 변수로 떠오른 '프롬 스크래치'

독파모는 글로벌 AI 모델 의존에 따른 기술·문화·경제 안보적 종속 문제를 해소하는 국가 프로젝트다. AI 3강 도약을 위해 국민 생활과 밀접한 영역에서 독자적으로 활용할 수 있는 AI 모델 확보가 목표다.

프로젝트는 공모 당시부터 '독자성'을 중점 요소로 삼았다. 과기정통부는 공모 안내서에서 독파모의 정의를 '해외 모델 파인튜닝 등으로 개발한 파생형 모델이 아닌 모델 설계부터 사전학습 과정 등을 수행한 국산 모델'로 정의했다. 즉 아무리 성능이 뛰어나더라도 해외 모델을 단순히 변형했다면 '독자 AI'에 해당하지 않는다는 의미다.

그래서 주목해야 할 개념이 프롬 스크래치다. 프롬스크래치는 데이터 수집부터 모델 설계, 학습 알고리즘 구축, 데이터 처리 등 AI 모델 기획과 구축을 처음부터 끝까지 독자적으로 수행하는 방식을 뜻한다. 정부가 독자성을 강조한 만큼 프롬 스크래치가 이번 프로젝트에서도 중요한 평가 요소로 작용할 거라는 게 업계 전망이었다.

이런 가운데 네이버클라우드는 '하이퍼클로바X 시드 32B 씽크'에 중국 알리바바 오픈소스 AI '큐웬 2.4' 비전 인코더를 활용해 프롬 스크래치가 논란을 불러일으켰다. 비전 인코더는 이미지·영상, 음성 데이터를 숫자 값으로 변환해 AI가 이해할 수 있도록 하는 모듈이다.


지난해 9월 9일  '독자 AI파운데이션 모델' 프로젝트 착수식에서 5개 정예팀 대표들이 배경훈 과기정통부 장관과 기념촬영을 하는 모습. (사진 왼쪽부터)임우형 LG AI연구원장, 김유원 네이버클라우드 대표, 배경훈 장관, 이연수 NC AI 대표, 유영상 SKT 사장, 김성훈 업스테이지 대표. [사진: 과기정통부]

지난해 9월 9일  '독자 AI파운데이션 모델' 프로젝트 착수식에서 5개 정예팀 대표들이 배경훈 과기정통부 장관과 기념촬영을 하는 모습. (사진 왼쪽부터)임우형 LG AI연구원장, 김유원 네이버클라우드 대표, 배경훈 장관, 이연수 NC AI 대표, 유영상 SKT 사장, 김성훈 업스테이지 대표. [사진: 과기정통부]


AI 모델에서 가중치는 데이터·연산·선택의 결과를 수치로 표현한 값이다. 사실상 AI 모델의 '지능'이나 마찬가지다. 비전 인코더를 차용한 것은 눈이나 귀를 빌린 정도로 볼 수 있지만, 가중치까지 가져온 건 다른 모델의 지능까지 차용한 것이라는 지적이 나왔다.

과기정통부도 네이버클라우드가 중국 모델 가중치를 채택한 게 프롬스크래치 기준에서 벗어났다고 봤다. 네이버클라우드는 벤치마크 평가는 넘었지만 독자성 평가에서 고배를 마셨다. 과기정통부는 1차 평가 결과를 발표하면서 "오픈소스를 활용하는 것이 일반적인 추세이긴 하나 가중치를 초기화 후 학습하면서, AI모델을 개발해나가는 것이 국내외 AI업계·학계 전반에 통용되는 독자 AI모델의 기본조건"이라고 설명했다.

이성엽 고려대 기술경영전문대학원 교수는 "정부가 강조하는 소버린 AI의 취지를 생각해보면 독파모는 기술 종속 우려가 없어야 한다"며 "이번 과기정통부 판단은 이미 예상이 가능했다"고 진단했다. 국가 핵심 인프라에 적용할 AI를 확보하는 사업이라는 점을 감안하면 외부 모델 사용 논란이 있는 팀을 통과시키기 어려웠을 것이란 분석이다.


◆'독자' 기준 재설정 논의 필요성 대두

다만 단순한 아키텍처 차용까지 프롬 스크래치 저촉으로 보는 것은 무리라는 의견도 제시된다. 과기정통부 설명처럼 이미 오픈소스 활용이 대세인데다 글로벌 모델 성능 95%를 목표로 잡은 프로젝트라면 라이선스 이슈가 없는 선에서 해외 모델 차용을 일부 허용하자는 의견이다.

이경전 경희대 빅데이터응용학과 교수는 "프롬 스크래치를 핵심으로 생각하는 것은 재고할 필요가 있다"며 "중요한 건 권리 관계"라고 말했다. 소버린 AI 관점에서 중요한 건 스스로 모델을 고치고 운영할 수 있는 통제권이다. 이런 조건만 확보할 수 있다면 반드시 프롬 스크래치를 고집할 필요가 없다는 뜻이다


독파모에 참여한 정예팀이 독자성을 판단하는 데 한계가 있다는 지적도 나온다. AI 모델은 데이터 학습, 구조 설계, 추론 방식, 데이터 처리 등 다양한 요소가 결합되기 때문이다. 이성엽 교수는 "(정부가 독자성 기준에 대해) 가급적 구체적인 기준을 명시하는 것은 필요할 수 있다"고 말했다.

업계에서는 이번 네이버클라우드 탈락이 독자 AI 모델 정책의 강도를 보여주는 신호탄으로 해석한다. 향후 평가에서도 독자성 논쟁이 반복될 가능성이 크다는 것이다. 업계 관계자는 "앞으로의 경쟁은 성능 뿐 아니라 독자성을 강조하는 것도 하나의 관전 포인트가 될 것"이라고 말했다.

한편 이번 1차 평가에서는 네이버클라우드를 비롯해 NC AI가 탈락했다. NC AI는 벤치마크 평가 문턱을 넘지 못했다.

과기정통부는 1차 평가에서 1개팀만 탈락시킨다는 당초 계획에 따라 추가 1개팀을 선정해 4개 정예팀 체제로 2차 단계평가를 실시한다. 네이버클라우드와 NC AI는 재도전하지 않겠다는 입장을 밝혔고 1차 정예팀 공모에서 탈락했던 카카오도 불참 의사를 밝혔다.

업계에서는 1차 정예팀 공모에서 탈락했던 KT, 모티프테크놀로지스, 코난테크놀로지 등을 재도전 가능성이 높은 팀으로 보고 있다.

<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>