컨텐츠로 건너뛰기
검색
디지털투데이 언론사 이미지

"'독파모' 정예팀 1곳 추가 선발, 사업 취지 고려한 것... 패자 부활전 아닌 재도전"

디지털투데이
원문보기

"'독파모' 정예팀 1곳 추가 선발, 사업 취지 고려한 것... 패자 부활전 아닌 재도전"

서울맑음 / -3.9 °
[황치규 기자]
류제명 과기정통부 2차관이 15일 독자파운데이션 모델 1차 평가 결과에 대해 브리핑하고 있다.

류제명 과기정통부 2차관이 15일 독자파운데이션 모델 1차 평가 결과에 대해 브리핑하고 있다.


[디지털투데이 황치규 기자]정부가 추진하는 독자 파운데이션 모델 개발 사업에 참여하는 정예팀 5곳을 상대로한 1차 평가에서 LGAI연구원, SK텔레콤, 업스테이지가 2단계에 진출했다.

NC AI와 네이버클라우드는 고배를 마셨다. NC AI는 벤치마크 문턱을 넘지 못했고 네이버클라우드는 정부가 제시한 독자성 기준을 충족하지 못해 1차 평가에서 탈락했다.

네이버클라우드의 경우 정부는 독자 파운데이션 모델들 중 하나로 선보인 하이퍼클로바X 시드 32B 싱크가 알리바바 큐원 2.5 비전 인코더 웨이트(가충지) 일부를 파인튜닝해 사용한 점이 독자성 기준에 맞지 않다고 과기정통부는 판단했다.

과기정통부는 당초 1차 평가에서 4개 업체를 선발할 예정이었으나 예상치 않게 2개 업체가 탈락하면서 가능한 빠른 시일 내에 1곳을 추가로 선발할 계획이다. 가급적 많은 국내 기업들에게 AI 개발 경험을 제공하는 취지를 고려한 결정이라고 과기정통부는 설명했다.

추가 선발에는 1차 평가 탈락 기업들은 물론 그 전에 공모에 참여했거나 아예 참여하지 않았던 회사들도 참여할 수 있다. 류제명 과기정통부 2차관은 "2차 단계에 진출한 3개 업체들과 동일한 경쟁이 이뤄질 수 있도록 소속한 시일내에 추가로 1곳을 선정하겠다"고 말했다.

다음은 독자 파운데이션 모델 사업 1차 평가 브리핑을 진행한 후 류제명 차관과 가진 일문 일답이다.


-추가 정예팀 모집 관련 선발 기준이나 시점이 궁금하다.

1차 평가 결과 예상치 못하게 공석 1곳이 생긴 만큼, 최대한 빨리 행정 절차를 마무리해 조속하게 추가로 선발할 것이다. 추가 선발에는 1차 평가에서 탈락한 회사들이나 예비 심사에 참여한 10개 컨소시엄이나 그 외 업체들도 참여할 수 있다. 컨소시엄을 구성할 역량이 있는 기업들에게 기회를 모두 주고자 한다. 빠른 시간 내에 공고를 낼 것이다.

-1차 평가를 앞두고 독자성 관련해 논란이 있었다. 네이버 클라우드의 경우 오픈소스 인코더를 활용한 것이 문제가 된 건가.


공모 안내서를 통해 독자 AI 파운데이션 모델이 갖춰야 될 기본적인 조건들을 포함했다. 그런 측면에서 봤을 때 오픈소스 모델을 활용했다 하더라도 가중치는 깨끗하게 비우고 스스로 확보한 데이터로 채워나갔어야 했다는 입장이다. 네이버클라우드는 라이선스 이슈가 있었던 것은 아니지만 가중치를 그대로 갖다 쓴 것은 문제가 있다고 평가위원들은 판단했다. 오픈소스 활용이 글로벌 트렌드인 것은 맞다. 하지만 독자 AI 파운데이션 모델 사업이 본질적으로 지향하는 것은 처음부터 스스로 직접 설계하면서 경험하는 것이었다. 네이버클라우드에 대한 결정은 이런 측면에서 봐주면 좋을 것 같다.

-2단계 평가 일정 및 추가로 1곳 선발 계획은 어떻게 되나.

1단계를 통과하지 못한 기업들이 이의를 제기할 수 있어, 해당 업체들에게 안내를 했다. 10일 기간을 두고 이의 제기를 받은 다음 1차 평가를 완료한다. 2차에 진출한 3개 기업들이 새로 추가될 1곳 때문에 기다려선 안되기 때문에, 추가 선정 절차를 조속히 마무리할 계획이다. 추가로 참여하는 기업도 2차에 진출한 3개 업체와 동일한 프로젝트 기간과 정부 지원 GPU를 사용하게 된다.


-이번 사업은 최종 2개 업체를 선발하는게 목표다. 1차 평가에서 계획과 달리 2개 업체가 떨어졌다 해서 굳이 1곳을 추가할 필요가 있나. 형평성 논란이 있을 수도 있다.

소수가 참여하는 압축적인 경쟁 방식으로 사업을 진행하는 최종 목표가 2개 기업을 뽑기 위한 것이 아니다. 그것보다는 가장 경쟁이 치열한 환경을 만들고 가급적 많은 국내 기업들이 짧은 기간에 많은 성과를 낼 수 있는 구도로 설계한 것이다. 최대한 많은 기업들에게 GPU를 써보게 하고 기술 개발에 참여할 수 있도록 하는게 우선이다. 2차에 진출하지 못했다고 해도 참여 과정에서 기업들은 많은 것을 얻을 수 있다 추가 선발은 특정 기업들 배려하거나 급조한 접근이 아니라 사업 취지를 최대한 고려한 것이다.

-기준 관련해 논란이 있었는데, 앞으로 추가 선발이나 2차 평가에 앞서 독자성 판단에 대한 가이드라인을 보다 명확하게 제공해야 할 것 같다.

글로벌 프론티어 기업들을 포함해 오픈소스를 활용하지 않는 기업들은 없다고 봐도 괜찮다. 지금 현재 생성형 AI에서 출발점인 오픈소스 기숧 트랜스포머를 모두가 활용하고 있고 글로벌 빅테크 기업들에서도 오픈소스를 쓰는 것은 당연시 되고 있다. 오픈소스 활용 자체를 나쁘게 보는 것은 절대 아니다. 하지만 독자 파운데이션 모델 사업은 국내 기업들이 최대한 많은 경험을 해보도록 하는 것인 만큼, 다른 회사 것을 그대로 가져다 쓰는 것은 문제라 본 것으로 봐주면 좋겠다.

-네이버클라우드 외에 업스테이지, SK텔레콤도 1차 평가를 앞두고 독자성 관련해 논란이 있었지 않나.

학습 데이터 가중치의 경우 평가위원들 사이에서 네이버클라우드를 제외한 다른 4개 업체에 문제가 있다는 얘기는 없었다. 업스테이지는 레퍼런스 언급 문제에 대한 지적이 있었고 SK텔레콤도 지적이 약간 있었는데, 독자 파운데이션 모델 기준에서 벗어날 정도는 아니라고 봤다.

-네이버클라우드 측에서 인코더 활용과 관련해 사전에 문의가 있었나

확인한 바로는 없었다. 논란이 불거진 후 네이버클라우드에서 소명서를 보내왔는데, 이미 평가가 진행 중인 터라 평가에 반영하지는 않았다. 반영하면 절차상 문제가 있다고 봤다.

-1차 평가의 경우 벤치마크와 전문가 사용자 평가로 진행했는데, 2차 평가는 어떻게 진행되나

평가 기준의 경우 대상 업체들과 협의를 거쳐 만든 것이다. 기준은 크게 벤치마크, 전문가 평가, 실사용자 평가 3가지다. 전문가 평가는 결국 객관적인 성능 평가다. 기술적인 독창성이나 기술력을 확보해 다음을 어떻게 대비할 수 있느냐 등에 초점을 맞추고 있다. 사용자 평가의 경우 AI를 실제로 사용하는 현장에 있는 이들이 해당 AI가 얼마나 유용한가를 평가한다. AI는 매개변수가 많다고 해서 좋은 것만은 아니다. 크기는 작더라도 산업 현장에서 효율적으로 쓰일 수 있다. 이런 활용성도 대단히 중요하다. 2차 평가에서도 기준에 대한 큰 변화는 없을 것이다. 다만 프롬 스크래치 등에 대해 학계와 업계 전문가들을 의견을 좀더 수렴해 구체화할 계획이다. 평가 관련해 지적이 좀 있었는데 참여 업체들과 공감대 아래 기준을 만들었다는 점을 강조하고 싶다. 벤치마크 평가도 참여 업체들이 모두 수용하고 동의한 방법을 채택했다.

<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>