[독자 AI 파운데이션 모델 프로젝트 1차 결과]
[서울=뉴시스] 이영환 기자 = 배경훈 부총리 겸 과학기술정보통신부 장관이 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에 참석해 축사를 하고 있다. 2025.12.30. 20hwan@newsis.com /사진=이영환 |
'국가대표 AI(인공지능'을 뽑는 '독자 AI 파운데이션 모델' 프로젝트 1차 평가에서 LG AI연구원이 최고점을 득점했다.
15일 과기정통부는 독자 AI파운데이션 모델 프로젝트의 1차 평가결과를 발표했다. △벤치마크 평가(40점) △전문가 평가(35점) △사용자 평가(25점)에서 LG AI연구원이 모두 최고점을 얻었다.
벤치마크 평가는 △NIA(한국지능정보사회진흥원) 벤치마크 평가(10점) △글로벌 공통 벤치마크 평가(20점) △글로벌 개별 벤치마크 평가(10점)로 진행됐다.
NIA 벤치마크 평가는 수학, 지식, 장문이해와 더불어 AI안전연구소와 협업한 신뢰성, 안전성 분야까지 폭넓게 평가했다. 글로벌 공통 벤치마크 평가는 세계적으로 인정되는 벤치마크 13종(에이전트, 수학, 지식·추론, 지시 준수 등)이 활용됐다. 글로벌 개별 벤치마크 평가는 정예팀별 글로벌 타겟 모델(SOTA급)과 비교 가능한 벤치마크 5종에 대해 평가했다.
NIA 벤치마크 평가에서 SK텔레콤(SKT)과 LG AI연구원이 10점 만점 중 9.2점의 최고점을 득점했다. 글로벌 공통 벤치마크 평가는 LG AI연구원이 20점 만점 중 14.4점의 최고점을 득점했다. 글로벌 개별 벤치마크 평가는 업스테이지와 LG AI 연구원이 10점 만점 중 10.0점의 최고점을 득점했다.
이를 종합한 벤치마크 평가에서 LG AI연구원이 33.6점으로 최고점을 얻었다. 평균 점수는 30.4점이다.
전문가 평가는 10명의 산학연 외부 AI 전문가로 이뤄진 평가위원회가 진행했다. △개발전략 및 기술 △개발 성과 및 계획 △파급 효과 및 기여계획을 종합 평가했다.
평가위원회는 5개 정예팀이 공개한 모델별 테크니컬 리포트, AI 모델 훈련 상태 로그 등을 분석해 정예팀의 기술 개발 과정, 기술력 등을 심도있게 평가했다.
그 결과 LG AI연구원이 35점 만점 중 31.6점의 최고점을 득점했다. 평균 점수는 28.56점이다.
사용자 평가는 AI 스타트업 대표 등 49명의 AI 전문 사용자가 참여했다. 정예팀이 개발한 AI모델로 구축한 AI 사용 웹사이트를 기반으로 실제 현장 에서의 활용 가능성과 추론 비용 효율성 등을 심층적으로 분석했다.
사용자 평가 점수는 LG AI연구원이 25점 만점 중 25.0점의 최고점을 득점했다. 평균 점수는 20.76점이었다.
모든 평가 지표를 종합한 결과 평과 결과에 따라 최저점을 받은 NC AI 정예팀이 탈락했다. 다만 네이버클라우드는 과기정통부의 '독자성 기준'에 미치지 못해 탈락의 고배를 마셨다. 이에 따라 △LG AI연구원 클라우드 △SKT △업스테이지 등 3개팀이 2차 단계 평가에 임하게 됐다.
박건희 기자 wissen@mt.co.kr
Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
