‘국가대표 AI’ 1차 탈락팀은 네이버클라우드·NC AI...“1개 팀 추가 선발” : zum 뉴스

류제명 과학기술정보통신부 2차관이 15일 서울 종로구 정부서울청사에서 독자 AI 파운데이션 모델 프로젝트 1차 단계 평가 결과를 브리핑하고 있다./뉴스1

정부의 ‘국가대표 AI 모델 프로젝트’에 참여하고 있는 5개의 정예팀 중 네이버클라우드와 NC AI 팀이 15일 1차 탈락했다. NCAI 정예팀은 1차 단계 평가에서, 네이버클라우드 정예팀은 독자성 측면에서 탈락하게 됐다. 국가대표 AI 모델 프로젝트는 전세계 AI 상위 3위국에 오르기 위해 한국만의 주체적인 AI 모델을 구축한다는 목표로 그래픽처리장치(GPU)와 데이터 등 자원을 집중 지원하는 정부의 핵심 사업이다.

류제명 과학기술정보통신부 2차관은 15일 오후 정부서울청사에서 열린 ‘독자 AI 파운데이션 모델 프로젝트 1차 단계 평가 결과’ 브리핑에서 이같이 밝혔다. 이로써 업스테이지, SK텔레콤, LG AI연구원 정예팀은 2단계 진출하게 됐다.

이번 1차 단계평가는 △벤치마크(40점) △전문가 평가 (35점)△사용자 평가(35점)로 진행됐다. 3가지 부문에서 NC AI를 제외한 LG AI연구원, 네이버클라우드, SK텔레콤, 업스테이지 정예팀은 요건을 충족했다. 하지만 독자성 측면에서 네이버클라우드 정예팀은 떨어지게 됐다.

과기정통부는 “기술적, 정책적, 윤리적 측면에서 독자 AI 파운데이션 모델 기준을 평가한 결과 네이버클라우드 정예팀의 AI모델은 독자성 기준을 충족하지 못하는 것으로 판단됐다”며 “전문가 평가위원들도 독자성 한계에 대한 문제를 제기해 네이버클라우드 정예팀 탈락을 결정했다”고 설명했다.

과기정통부는 1차전에서 1개팀이 아닌 2개팀을 탈락시키면서 1개 정예팀을 추가로 선정할 계획이라고 덧붙였다. 추가로 뽑는 정예팀은 최초 프로젝트 공모에 접수한 컨소시엄, 이번 1차 단계평가 이후 정예팀에 포함되지 않은 컨소시엄(네이버클라우드, NC AI 컨소시엄), 그 외 기업 등 모두 지원 가능하다. 과기정통부 측은 “추가로 선정되는 1개 정예팀에게는 그래픽처리장치(GPU)·데이터 지원, ‘K-AI 기업’ 명칭 부여 등 독자 AI 파운데이션 모델 개발에 도전할 수 있는 기회를 제공할 예정이며 행정적 절차를 통해 정예팀 1곳의 추가 공모를 신속히 추진할 것”이라 설명했다.

그래픽=정서희

◇ 벤치마크·전문가 평가·사용자 평가서 LG AI연구원 최고점...NC AI는 탈락

1차 단계평가에서 LG AI 연구원은 전 영역에서 최고점을 획득했다.

정부는 우선 ‘벤치마크’ 점수는 한국지능정보사회진흥원(NIA) △벤치마크 평가(10점) △글로벌 공통 벤치마크 평가(20점) △글로벌 개별 벤치마크 평가(10점)로 진행했다. NIA 벤치마크 평가의 경우 수학, 지식, 장문 이해 뿐 아니라 AI안전연구소와 협업해 신뢰성, 안전성 도 함께 고려됐다. 글로벌 공통 벤치마크 평가는 세계적으로 인정되는 벤치마크 13종(에이전트, 수학, 지식·추론, 지시 준수 등 다수 영역 분포)을 선정해 평가가 진행됐다. 글로벌 개별 벤치마크 평가의 경우, 정예팀별 글로벌 타겟 모델(SOTA 급)과 비교 가능한 벤치마크 5종에 대해 평가가 이뤄졌다.

NIA 벤치마크 평가는 SK텔레콤과 LG AI연구원이 10점 만점 중 9.2점의 최고점을 득점했다. 글로벌 공통 벤치마크 평가는 LG AI연구원이 20점 만점 중 14.4점의 최고점을 득점했다. 글로벌 개별 벤치마크 평가는 업스테이지와 LG AI 연구원이 10점 만점 중 10.0점의 최고점을 득점했다. 이를 종합한 벤치마크 평가 점수는 LG AI연구원이 33.6점의 최고점을 득점했다. 5개 정예팀 평균은 30.4점이다.

전문가 평가는 총 10명의 산학연 외부 AI 전문가로 평가위원회를 구성해 각 팀이 제출한 자료를 바탕으로 장기간의 심층 평가를 추진했다. △개발 전략 및 기술 △개발 성과 및 계획 △파급효과 및 기여계획을 종합 평가했다고 한다.

평가위원회는 5개 정예팀이 공개한 모델별 테크니컬 리포트(Technical Report), AI모델 훈련 상태 로그(Log) 파일 등을 분석해, 정예팀의 기술개발 과정, 기술력(독자성 등 포함) 등을 평가했다. 전문가 평가 점수는 LG AI연구원이 35점 만점 중 31.6점의 최고점을 득점했다. 5개 정예팀 평균은 28.56점이다.

사용자 평가는 AI 스타트업 대표 등 49명의 AI 전문 사용자가 참여했다. 정예팀이 개발한 AI모델로 구축한 AI 사용 웹사이트를 기반으로 실제 현장 에서의 활용 가능성과 추론 비용 효율성 등을 심층적으로 분석했다. 사용자 평가 점수에서도 LG AI연구원이 25점 만점 중 25.0점의 최고점을 득점했다. 평균 점수는 20.76점이다.

◇ 네이버클라우드, 독자성 평가서 요건 충족 못해 탈락

정부는 △기술적 △정책적 △윤리적 측면을 아우르는 독자성 평가도 진행했다.

정부는 기술적 측면에서는 독창적 AI 모델 아키텍처 설계부터 대량의 데이터를 스스로 확보·가공하고 독자적 학습 알고리즘 기법 적용 등을 통해 전 과정 학습을 수행한 ‘AI모델의 독자적 구현’을 지향한다. 정부는 글로벌 AI생태계에서 오픈소스를 활용하는 것이 일반적인 추세이긴 하지만 가중치(Weight)를 초기화 후 학습(Training)하면서 AI모델을 개발해나가는 것이 국내외 AI업계·학계 전반에 통용되는 독자 AI모델의 기본조건이라 봤다. 따라서, 정예팀도 검증된 기술 활용과, 글로벌 AI생태계와의 정합성 확보, 글로벌 진출 등을 위해 검증된 오픈소스를 전략적으로 활용하더라도, 가중치를 초기화한 후 학습, 개발 수행하는 것이 모델의 독자성 확보를 위한 최소조건이라고 판단했다.

정책적 측면에서는 국방·외교·안보, 국가 인프라(전력망·교통·통신망) 등에 외산 AI모델을 활용 시, 국가 기밀 유출 우려나 국가 안보에 대한 위협 등이 발생할 가능성을 해소하기 위해 AI 모델을 언제든 스스로 개발·고도화(자주권)할 수 있고, 어떠한 상황에서도 주체적으로 AI모델의 운영·이용을 통제(통제권)할 수 있는 역량을 확보하는 것을 지향한다. 즉, 완전한 우리 기술로 AI모델을 개발하거나, 라이선스 제약 없는 오픈소스를 활용해 스스로 개발·고도화할 수 있어야 하며, 오픈소스 활용으로 인한 외부의 통제·간섭으로부터 자유로울 수 있어야 한다는 게 정부 측 입장이다.

윤리적 측면에서는 오픈소스를 활용하는 것이 일반적인 오늘날의 AI 생태계 구조에서 개발한 AI모델의 레퍼런스 고지 등 라이선스 정책을 준수하여, AI생태계 신뢰 확보, 공개 검증 강화, 투명성 제고를 통해 건전한 발전을 도모해야 할 필요가 있다고 봤다.

안상희 기자(hug@chosunbiz.com)

<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>

이 기사의 카테고리는 언론사의 분류를 따릅니다.