컨텐츠로 건너뛰기
검색
디지털데일리 언론사 이미지

빅테크에 맞설 '소버린 AI 후보군'... 독파모 공통 전략은 '효율과 확장성'

디지털데일리 이건한 기자
원문보기

빅테크에 맞설 '소버린 AI 후보군'... 독파모 공통 전략은 '효율과 확장성'

서울맑음 / -3.9 °
물량 공세 대신 '두뇌' 썼다... '저비용·고효율' 기술로 승부수



[디지털데일리 이건한기자] 지난 30일 서울 코엑스에서 열린 정부의 '독자 AI 파운데이션 모델 개발 프로젝트(독파모)' 1차 성과 발표회는 현장에만 1000여명에 달하는 민관 관계자, 일반 시민들이 참여해 성황리에 종료됐다.

특히 이번 독파모 사업은 향후 수년간 한국의 공공과 민간 전반의 AX를 선봉에서 책임질 '국가대표 AI' 구축 사업이다. 그만큼 세간의 관심이 집중된 가운데 5개 정예팀이 각각 개발한 독자 AI 모델들의 공통분모는 바로 '비용 효율성'과 '확장성'이었다.

이는 글로벌 AI 빅테크들처럼 천문학적인 자본과 인프라 기반의 '체급(Scale)' 경쟁이 불가능한 한국의 현실을 반영한 선택으로 풀이된다. 이번에 정예팀이 정부로부터 공급받은 GPU 1차분은 각 1000장이다. 여기에 각 사가 보유했던 GPU를 합산해도 이미 수십만장을 확보한 빅테크 기업들과 동등한 체급의 AI 모델 경쟁은 여전히 쉽지 않은 구조다.

또한 1차 개발까지 주어진 시간도 초기 세팅 시간을 포함해 4개월 남짓이다. 이처럼 비용과 시간이 극도로 제한된 상황에서 소위 '가성비' 좋은 모델을 빠르게 개발해야 향후 독파모 생존 경쟁에서도 우위를 확보할 가능성이 높아진다.

◆ 마른 수건도 쥐어짠다… "더 저렴하게, 더 빠르게"

이와 관련해 가장 직접적인 메시지를 던진 곳은 'Solaer open 100B'를 선보인 업스테이지다. 김성훈 업스테이지 대표는 "정부가 지원하는 GPU는 국민의 혈세인 만큼 1분도 허투루 쓰지 않으려 했다"며 철저한 비용 절감 노력을 피력했다. 실제로 업스테이지는 커널 최적화 등을 통해 학습 기간을 기존 대비 40% 이상 단축하고, GPU 전력 사용률을 92.2%까지 끌어올리는 등 '극한의 효율'을 증명했다.

LG AI연구원도 'K-엑사원'을 통해 동일 출력물에서 AI의 연산량을 70% 절감하는 '하이브리드 어텐션' 기술을 선보였다. 현세대 LLM(대형언어모델)을 이루는 핵심 기술 중 하나인 어텐션은 주어진 명령에 대해 기존의 학습 데이터를 전부 검토해 답을 도출하기 때문에 보통 모델이 커질수록 비용 효율이 떨어진다. 반면 연구원의 하이브리드 어텐션은 문제 유형을 분석해 모델 내 세부 전문가 AI 그룹에 문제를 분배(MoE)하고 공통 모델과 함께 최적의 답을 도출하는 방식으로 효율화를 꾀했다.


특히 이는 고가의 최신 엔비디아 GPU가 아닌 중저가형(A100) GPU에서도 구동 가능한 경제성을 확보했다는 설명이다. 이는 향후 스타트업이나 중소기업의 AI 도입 부담을 줄이는 요인이 된다.

NC AI 역시 '전문가 혼합(MoE)' 구조와 자체적으로 개선한 'MLA(Multi-Latent Attention)' 기술 등을 바탕으로 AI의 GPU 연산 시간을 15% 줄이고 메모리 사용량을 최대 83% 절감했다고 밝혔다. 이러한 성과도 결국 빠른 데이터 처리와 개발 시간 단축, 중장기적인 AI 운영 비용 절감으로 이어질 수 있다.

네이버클라우드는 '통합' 전략으로 비용을 줄였다. 텍스트, 이미지, 음성을 개발 단계에서부터 하나의 모델로 통합하는 '옴니모델(Omni Model)' 개발이 핵심이다. 이는 기존 멀티모달 AI 모델들이 다기능 수행을 위해 OCR(광학문자인식) 등 외부 기능을 별도로 붙이고 호출해 쓰는 방식 대비 구축 비용과 복잡성을 획기적으로 낮출 수 있다는 설명이다.


이어 유일하게 5000억(500B) 개라는 압도적 규모의 매개변수를 앞세운 SK텔레콤조차 그 이면에는 '효율성'을 깔고 있다. 이에 대해 정석근 SKT AI CIC장은 잘 만든 대규모 모델(SKT A.X K-1)이 향후 소형 모델(SLM)을 가르치는 '교사 모델' 역할을 수행함으로써 분야별로 필요한 파생 모델 개발의 효율을 극대화할 수 있다고 강조했다.

이 경우 SKT 모델은 몇몇 독자 AI 모델만으로 대응이 어려운 전문 분야, 중대형 모델 수요처에서 효과적인 AI 개발을 돕게 된다. 단지 체급을 키우는 것 자체가 목적이 아니라 산업 전반에 효율적으로 확산 가능한 기반 모델 개발을 노린 셈이다.

◆ 산업 현장부터 공략하는 AI국내외 공략 박차

비용 효율성과 확장성이 생존과 실리를 챙기는 키워드였다면, 정예팀들은 본 프로젝트의 주요 목표인 국가적 AI 주권 확립에도 힘을 실었다. 특히 제조, 국방, 금융 등 국내 핵심 산업에 즉시 이식 가능한 파생 모델과 생태계 전략에 집중한 모양새다.


엔씨 AI는 제조 현장의 복잡한 맥락을 이해하는 'VAETKI' 모델과 이를 쉽게 배포할 수 있는 '도메인옵스' 플랫폼을 통해 기술의 문턱을 낮췄다. 업스테이지는 일본, 태국 등 아시아권 국가에 특화 모델을 수출하며 글로벌 확장성을 입증했다. 네이버클라우드와 LG AI연구원 역시 각각 사우디·동남아 시장과 글로벌 금융·바이오 파트너십을 통해 'K-AI' 영토 확장에 나선 상태다.

다만 이번 발표회가 일반 참관객들에게 체감 가능한 결과물을 보여주기엔 다소 부족했다는 평가도 나온다. 무엇보다 물리적 한계의 영향이 크다. 독파모 프로젝트가 가동된 지 불과 4개월 남짓 지난 시점으로, 이번 발표회는 완성된 서비스보다는 연구 성과를 종합하고 향후 로드맵을 제시하는 중간 점검 성격이 짙었다. 현장 부스 체험이나 시연도 PPT 생성, 검색, AI 휴먼 등 기존 LLM 서비스의 연장선에 머문 사례가 많았다.

업계 관계자는 "이번 발표회는 예선전 격으로 각 사가 향후 어떤 철학과 전략으로 AI G3 도전을 위한 난제를 풀어갈지 그 방향성을 확인한 자리"라고 평가했다. 이제 다가올 가까운 일정은 첫 공식 평가다. 이에 5개 컨소시엄은 최근 정부에 1차 평가 필요 서류들을 제출 중인 것으로 전해진다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -