컨텐츠로 건너뛰기
검색
디지털데일리 언론사 이미지

[나는 K-AI다]② ‘독자성 최소 조건’ 명확히 했어야…오픈소스 트라우마 우려

디지털데일리 오병훈 기자
원문보기

[나는 K-AI다]② ‘독자성 최소 조건’ 명확히 했어야…오픈소스 트라우마 우려

서울맑음 / -3.9 °
정부가 추진하는 ‘독자 AI 파운데이션모델 프로젝트’ 2차 평가 진출 정예팀이 결정됐다. LG AI 연구원, SK텔레콤, 업스테이지 정예팀은 진출에 성공했지만 네이버클라우드, NC AI 정예팀은 고배를 마셨다. 1차 평가에서 4개 정예팀을 가리겠다고 했던 당초 계획과 다른 결과에 업계 충격도 적지 않다. 네이버클라우드 정예팀이 독자성 문제가 불거지면서 2차 진출이 무산되면서다. 이에 <디지털데일리>가 1차 평가 과정을 돌아보면서 업계 및 전문가들의 목소리를 들어보고 이어지는 2차 평가에 대한 전망을 집중적으로 살펴봤다.<편집자주>




[디지털데일리 오병훈기자] ‘독자 AI 파운데이션모델(독파모)’ 프로젝트 2차 평가를 앞두고 정부에 떨어진 최대 과제는 독자성 논란을 최소화하는 것이다. 1차 평가 과정에서는 네이버클라우드를 중심으로 업스테이지, SK텔레콤까지 독자성 시비에 휘말리며 업계의 관심이 집중됐다.

특히 네이버클라우드의 경우 독자성 논란이 생존 여부를 가를 핵심 변수로 작용했다. 이 과정에서 정부와 평가기관이 제시한 독자성 기준에 대한 업계의 관심도 한층 높아졌다. 정부는 ‘AI 통제권 확보’를 핵심 개념으로 내세우며 독자성을 판단하는 세 가지 관점을 제시했고, 향후 독자성 수준에 따라 차등 배점하는 방식을 도입하겠다는 방침도 밝혔다.

전문가들은 정부가 기술적 측면에서 독자성의 최소 조건으로 ‘가중치’를 제시한 점에는 일정 부분 타당성이 있다고 평가한다. AI 생태계 전반에서 가중치를 그대로 활용하는 방식은 일반적이지만 적어도 ‘국가대표’ ‘독자’ AI를 개발하는 프로젝트에서는 지양됐어야 할 요소라는 지적이다. 자체 개발 역량을 강화하겠다는 정책 취지와도 맞닿아 있다는 분석이다.

다만 프로젝트 공모 단계부터 독자성의 최소 기준을 보다 명확히 제시했어야 한다는 비판은 여전히 이어지고 있다. 특히 독자성 논란이 확산되며 오픈소스 활용 전반에 대한 부정적 인식이 번지는 것은 업계 전체에 부담이 될 수 있다는 우려도 나온다. 오픈소스 활용이 마치 ‘베끼기’로 인식되는 상황은 경계해야 한다는 지적이다.

◆평가위원 “인코더보단 가중치가 문제”...기술적 측면 최소조건으로

네이버클라우드의 2차 평가 진출 좌절은 오픈소스 인코더 할용 문제에서 비롯됐다. 네이버클라우드가 독파모로 공개한 ‘하이퍼클로바X-Think-32B·옴니-8B’ 모델에는 이미지·음성 인코더로 중국 알리바바가 공개한 오픈소스 모델 ‘큐웬2.5 ViT’가 활용됐다. 인코더는 이미지나 음성 정보를 AI가 이해할 수 있는 데이터로 바꿔주는 역할을한다. 비유하자면 옴니모달 AI의 ‘눈과 귀’에 해당한다.

네이버클라우드가 자체 개발한 인코더도 있지만 글로벌 기술 생태계 호환성과 시스템 효율 최적화 등을 고려해 개발 과정에 큐웬2.5ViT를 활용했다는 것이 네이버클라우드의 설명이다. 1차 평가 과정에서 각종 벤치마크 점수와 전문가 평가와 사용자 평가 등에서 유리한 고점을 선점하기 위해 보다 안정적으로 증명된 외부 인코더를 사용한 것으로 풀이된다.


평가위원들이 문제 삼은 것은 인코더 활용 그 자체는 아니다. 인코더에 포함된 ‘가중치’를 그대로 차용한 것이 화근이었다. 가중치는 AI 학습 결과물에 해당한다. AI 학습의 결과물 자체를 가져와 쓰는 것이 이번 독파모 정책 취지와는 거리가 있다는 것이다.

정해동 정보통신기획평가원 AI PM은 15일 열린 독파모 1차 결과발표 브리핑에서 “외부 인코더를 활용하는 것들은 개발 단계에서 일반적으로 활용하는 방법”이라면서도 “인코더를 활용했을 때 가중치를 (새롭게) 업데이트할 수 있는 형태가 아니라 고정된 형태였기 때문에 외부의 인코더와 가중치를 그대로 활용한 것이라 볼 수 있으며 이를 독파모로 인정하기 어렵다는 내부 판단이 있었다”고 말했다.

정부에서 이번 논란에 대응하기 위해 마련한 독자성 판단 세 가지 관점(기술·정책·윤리)에서도 해당 내용이 언급된다. 기술적 측면에서는 독창적 AI 모델 아키텍처 설계부터 대량 데이터를 스스로 확보·가공하는 것을 지향한다. 독자적 학습 알고리즘 기법 적용 등을 통해 전 과정 학습을 수행한 AI모델의 독자적 구현이 우선이라는 설명이다.


구체적으로는 검증된 오픈소스를 전략적으로 활용하더라도 가중치를 초기화한 후 학습·개발을 수행하는 것이 모델 독자성 확보를 위한 ‘최소조건’이라는 게 정부 및 평가위원들의 판단이다.

일각에서는 정부의 취지에 공감하는 목소리가 나온다. 가중치까지 그대로 사용하는 것은 개발 과정에서 빈번하게 활용되는 방법이다. 하지만 국가대표 독파모를 선정하는 과정인 만큼 과정에서도 보다 세심한 접근이 필요했다는 지적이다.

류제명 과학기술정보통신부 2차관은 “프로젝트 취지에 비춰보면 스스로 모델도 설계해 보고 가중치가 초기화된 상태에서 학습 경험을 쌓아보자는 것이 중요하다”며 “이를 통해 앞으로 오픈소스를 활용하더라도 더 경쟁력 있는 AI 모델을 만들 수 있다는 판단”이라고 말했다.


한 AI 전문가는 “큐웬2.5 ViT’ 경우 AI 오픈소스 생태계에서 자주 통용되는 인코더이기 때문에 네이버클라우드가 의도적으로 이를 차용했다고 보기는 어렵다”며 “그러나 가중치를 그대로 활용했다는 점은 정부 프로젝트 취지와는 거리가 있는 것은 분명하다”고 진단했다.


◆정부 “오픈소스 활용 죄악시 안돼”업계 “결과 달라졌을듯” 지적도

문제는 ‘오픈소스는 활용해도 되지만 가중치는 초기화 해야 한다’는 식의 구체적인 지침이 독파모 평가 시작 단계에서 설정되지 않았다는 점이다. 자유로운 개발 환경 조성 및 공정성 등을 이유로 평가 기준 전체를 공개할 수는 없겠지만 적어도 ‘금지사항’에 해당하는 독파모 최소조건 정도는 사전에 설정됐어야 한다는 비판이 나온다.

정부에서는 앞서 독파모 프로젝트 개시 때 “‘파인튜닝(미세조정)’ 등을 통한 AI 모델은 독파모로 간주되지 않는다”며 공지한 바 있다. 또 “파생형 모델이 아닌 모델의 설계부터 사전학습 과정 등을 수행한 국산 모델”이라는 점도 강조했다.

이 같은 지침은 사전학습의 방법이나 그 범위 등에 대한 설정이 명확하지 않다는 것이 전문가 분석이다. 특히 네이버클라우드 개발 방식은 AI 생태계에서 지극히 일반적이라는 게 업계의 중론이다. 옴니모달AI의 핵심은 ‘데이터에 대한 종합적인 이해’에 있다. 옴니모달AI의 ‘두뇌’에 해당하는 아키텍처나 알고리즘은 네이버클라우드 자체 사전학습을 통해 개발됐다. 성능 검증 단계에서 눈과 귀에 해당하는 인코더를 큐웬2.5 ViT로 차용한 것이다.

또 다른 AI 전문가는 “정부가 15일에 발표한 독파모 기술적 최소조건이 프로젝트 초기 단계부터 명확했다면 결과가 달라졌을 것”이라며 “최소한의 조건을 논란이 본격화된 이후에 마련한 점이 가장 아쉬운 부분”이라고 강조했다. 이어 “정부가 독자성의 핵심으로 AI 통제권을 내세웠는데, 네이버클라우드가 차용한 큐웬2.5 ViT 라이선스 문제도 없기 때문에 통제권을 잃었다고 보기에는 무리가 있다”고 분석했다.

더 나아가 이번 논란은 AI 생태계에 부정적인 영향을 줄 수 있다는 비판도 나오고 있다. 네이버클라우드가 오픈소스를 차용한 것을 두고 ‘컨닝’을 한 것처럼 묘사되는 여론이 지속되면서 오픈소스에 대한 인식 자체가 부정적으로 변하는 상황은 경계해야 한다는 설명이다.

정부도 이 같은 비판을 인지한 분위기다. 브리핑에서는 관련 사안을 염두에 둔 듯 당부의 발언이 여러 차례 나왔다.

류 차관은 브리핑에서 “글로벌 시장에서 오픈소스를 활용하지 않는 기업은 없다고 봐도 무방하다”며 “오픈소스 활용이 죄악시된다는 것은 아니며 개발 단계별로 오픈소스 라이선싱 조건에 따라서 적절하게 활용하는 것은 AI 생태계에서 당연한 것”이라고 강조했다.

정부는 이번 논란을 계기로 2차 평가에서부터는 독자성에 대한 배점 기준을 마련할 계획이다. ‘독자적인 정도’에 따라서 점수를 차등 배점하는 방식으로 평가하겠다는 설명이다.

김경만 과기정통부 인공지능정책실장은 “프롬스크래치에 대한 기준은 학계나 업계, 전문가들 의견을 수렴해 차등 배점을 구체화하겠다”며 “(1차 평가 때와 같은) 문제가 발생하지 않도록 조치하겠다”고 설명했다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -