[‘국대 AI' 표절 시비]
공개 검증회(업스테이지 제공)/뉴스1 |
정부가 ‘국가대표 AI’를 선발한 것은 챗GPT·딥시크·제미나이 같은 글로벌 프런티어급 생성형 AI 모델이 빠르게 국내 시장을 잠식하면서 해외 AI에 기술이 종속될 수 있다는 위기의식 때문이다. ‘AI 3대 강국’ 실현을 목표로 내세운 정부는 해외 AI에 의존하지 않는 독자적인 AI 파운데이션 모델을 개발해 AI 주권을 확보하겠다는 전략을 세웠다.
정부는 지난해 국가대표 AI 선발 당시 해외 AI 모델을 미세 조정하지 않고 모델 설계부터 학습까지 자체적으로 수행한 독자 AI 파운데이션 모델 개발을 목표로 제시했다. ‘프롬 스크래치(from scratch)’ 방식으로 개발한 독자 AI 모델을 만들겠다는 것이다. 프롬 스크래치는 ‘아무런 준비 없이 처음부터’라는 뜻을 가진 영어 관용구다. 즉 국대 AI 기업들이 기존에 만들어진 AI 소스를 재활용하지 않고 처음부터 끝까지 AI 모델을 새로 구축하는 것을 말한다. 정부는 국가대표 AI 공고에서도 ‘타사 모델에 대한 라이선싱 이슈가 없어야 한다’고 밝혔었다.
국대 AI를 둘러싼 프롬 스크래치 논란은 지난 1일 AI 스타트업 사이오닉 AI의 고석현 CEO(최고경영자)가 깃허브에 올라온 리포트를 인용해 “국민 세금이 투입된 프로젝트에 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출된 건 상당히 큰 유감”이라는 글을 올리면서 처음 시작됐다. 해당 리포트는 업스테이지가 국대 AI 1차 평가에 제출한 모델(솔라 오픈 100B)과 중국 AI 모델(GLM 4.5 에어)을 비교한 결과 AI 모델 신경망 중 특정 부분이 중국 모델과 96.8% 동일하다는 내용이 들어 있다.
김성훈 업스테이지 대표는 곧바로 지난 2일 공개 검증회를 열고 실험 기록을 모두 공개했다. 김 대표는 “프롬 스크래치 여부를 판단할 수 있는 것은 로스(Loss)인데, 로스가 높다는 건 처음에 학습이 안 됐다는 것을 의미한다”며 “솔라 오픈은 초기 높은 로스로부터 학습됐다”고 말했다. AI 모델의 경우 처음에는 백지 상태이기 때문에 질문을 던질 경우 오답률이 높다는 것이다. 이후 고 CEO가 사과 글을 올리며 논란은 일단락됐다.
[김강한 기자]
- Copyrights ⓒ 조선일보 & chosun.com, 무단 전재 및 재배포 금지 -
