[MT리포트]닻 올린 AI 국가대표 선발전(下)
━
소버린AI 출사표 던진 교수들..."세계 최고 AI 개발, 희망 보인다"
━
![]() |
지난 2월 서울 강남구 코엑스에서 열린 일렉스 코리아·코리아 스마트그리드 엑스포의 AI(인공지능) 지원 마이크로 모듈형 데이터 센터 모형 /사진=뉴스1 |
"국내 최우수 AI(인공지능) 인재가 한국을 떠나지 않고도 세계 최고의 AI를 만들 수 있다는 희망을 가질 계기가 되길 바란다. GPU(그래픽처리장치)가 없어서 한국에서 AI 못한다는 이야기가 이제는 옛말이 되면 좋겠다."
황성주 KAIST(카이스트) AI대학원 교수는 학계와 산업계에서 바라보는 '독자 AI 파운데이션 모델 프로젝트'의 의의를 이처럼 설명했다. 황 교수는 지난 10년간 AI 최고 국제학회에서 논문을 가장 많이 발표한 국내 연구자로 잘 알려져 있다.
황 교수는 "국내 연구자와 스타트업들은 혁신적이고 창의적인 기술을 갖고 있다. 하지만 한 장에 수천만 원을 호가하는 GPU를 자체 공급하는 건 불가능했다. 이번 기회로 한국에서도 드디어 무언가 제대로 시도해볼 수 있겠다는 희망을 본 것"이라고 했다. 그는 "연구 현장에서 활발히 논문을 발표 중인 박사생들이 해외 빅테크의 취업 제안을 마다하고 이번 개발에 뛰어들기로 한 게 그 증거"라며 "(이번 사업은) 인프라에 목말랐던 AI 업계에 그만큼 큰 의미"라고 덧붙였다.
황 교수가 이끄는 KAIST팀은 AI 설계부터 데이터 학습 과정까지 모든 과정을 공개한 '완전 개방형 오픈소스' 모델을 만들 계획이다. 여기에 신뢰할 수 있는 고품질 데이터만 골라 학습하는 신기술을 적용하는 게 목표다. 그는 "학교나 스타트업이기 때문에 가능한 혁신적인 기법이 있다. 전형적인 '빅테크 따라잡기'가 아닌 한국 맞춤형 AI, 선도적인 AI를 개발하는 데 초점을 두고 선발이 이뤄지길 바란다"고 했다.
KAIST팀에는 엔비디아의 AI연구 선임 디렉터인 AI 석학 최예진 미국 스탠퍼드대 교수, '멀티모달 LLM(거대언어모델)'의 원조 격으로 불리는 '라바(LLaVA)' 개발을 주도한 이용재 미국 위스콘신대 교수가 합류할 예정이다.
또 다른 컨소시엄에 참여하는 최재식 KAIST AI대학원 교수는 "한국에서 '딥시크'가 나오지 않은 건 기술력이 없기 때문이 아니라 그간 산·학·연의 다양한 주체가 갖고 있는 기술이 한데 뭉치지 못하고 파편화돼 있었기 때문"이라고 했다. 그는 "선발된 5개 정예팀이 또다시 2차, 3차 경쟁을 벌이는 과정을 통해 최고 수준의 기술이 탄생할 것이란 게 학계의 가장 큰 기대감"이라며 "다만 사업에 참여할 기관이 더 혁신적인 기법을 실험해볼 수 있도록 데이터 규제 완화 등 제도적인 차원의 지원책이 필수적으로 뒤따라야 할 것"이라고 강조했다.
최 교수는 "이 사업을 계기로 한국에서 GPU 없어서 AI를 못 한다는 이야기는 사라지지 않을까 싶다"는 그는 "사업이 진행되는 2년 동안 한국은 AI 개발에 있어 우리에게 부족한 것이 무엇인지 정확히 파악할 수 있게 될 것"이라며 "이 과정을 통해 점차 '소버린 AI'에 가까워지리라 믿는다"고 했다.
![]() |
황성주 KAIST 교수(왼쪽), 최재식 KAIST 교수(오른쪽) /사진=KAIST |
━
소버린AI, '내수용' 꼬리표 떼려면…"데이터 풀고 글로벌화 필요"
━
![]() |
AI사업 운영상 느끼는 애로사항/그래픽=이지혜 |
정부의 소버린 AI(인공지능) 구축 지원 사업이 시작되면서 업계 안팎에선 기대와 우려가 동시에 제기된다. 국내 AI 모델이 경쟁력을 갖출 기회이지만 이렇게 만들어진 AI 모델이 '내수용'에 그치지 않고 글로벌 시장에서도 경쟁력을 갖추려면 넘어야 할 산도 많다는 지적이다.
21일 과학기술정보통신부에 따르면 이번 '독자 AI 파운데이션 모델 프로젝트'의 지원 분야는 GPU(그래픽처리장치) △데이터 △인재 등 3가지다. 기업이 필요한 1~3가지를 선택해 지원받을 수 있도록 했다. 통상 거론되는 AI 모델 개발을 위해 필요한 3대 자원을 모두 포함시켰다는 평가다.
다만 이번에 지원받는 독자 AI 모델이 글로벌 경쟁력을 갖추기 위해선 제도 개선 등 추가 지원이 필요하단 지적이 나온다. 특히 업계는 데이터 분야의 지원 확대를 강조한다. 정부가 이번 사업에서 저작물 데이터 공동구매 등으로 기업을 지원해주고 있지만 고품질 데이터를 확보할 수 있도록 지원해주지 않고선 근본적으로 경쟁력을 강화하기 어렵다는 지적이다.
실제 소프트웨어정책연구소의 '2024년 인공지능산업 실태조사'에 따르면 AI 기업의 애로사항에 대한 5점 척도에서 '데이터 확보 및 품질 문제'는 3.59점으로, 투자유치(4.21)나 사업 불확실성(3.77) 같은 경영 부문을 제외하면 가장 큰 애로사항으로 꼽혔다.
반면 중국과 미국의 빅테크 기업들은 데이터 확보에 거침이 없다. 최근 미국에서는 메타와 앤트로픽이 수백만권의 책을 저작권자와 합의 없이 AI에 학습한 사실이 드러났지만, 재판부에서 무죄 판결을 받기도 했다. AI 학습이 '공정 이용'에 해당해 경우에 따라서 저작권에 우선할 수 있다는 판결이다.
![]() |
AI사업 운영 상 느끼는 애로사항 중 '데이터 확보 및 품질 문제'에 동의한다/그래픽=이지혜 |
한 AI 스타트업 대표는 "미·중처럼 AI 학습을 최우선시하는 게 무조건 옳다곤 할 수 없지만 그 덕에 AI 모델이 빠르게 고도화된 것은 사실"이라며 "정부가 데이터를 어디까지 어떻게 수집할 수 있는지 사회적 합의를 마련해줘야 한다"고 말했다.
개발된 AI 모델이 단순히 '한국어 잘하는 챗GPT'에서 그치지 않기 위해선 글로벌 경쟁력을 갖추기 위한 고민을 병행해야 한다는 지적도 있다. 한 벤처캐피탈 심사역은 "오픈AI의 GPT가 강력한 것은 미국에서 만들어져서가 아니라 전 세계 사용자들이 사용하며 피드백을 줬기 때문"이라며 "독자 AI 모델도 민간 생태계와 글로벌 피드백을 받을 수 있는 구조를 고민해야 한다"고 했다.
이번 사업에 참여한 AI 기업 대표도 "독자 AI 모델 구축 기업들이 내수용에 그치지 않고 일본이나 동남아시아 등에서 미·중의 AI 모델보다 경쟁력이 있는 AI 모델이 될 수 있도록 고도화하는 방안을 고민해야 한다"며 "정부도 이를 세일즈할 수 있는 방법 등을 함께 모색해야 할 것"이라고 말했다.
[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]
박건희 기자 wissen@mt.co.kr 고석용 기자 gohsyng@mt.co.kr 남미래 기자 future@mt.co.kr
Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.