컨텐츠 바로가기

06.17 (월)

만물박사 아닌 ‘전문 박사’… 싸고 가벼운 AI가 뜬다

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

빅테크 ‘소형 거대언어모델’ 경쟁

조선일보

일러스트=김성규

<이미지를 클릭하시면 크게 보실 수 있습니다>


마이크로소프트(MS)는 지난 21일 미국 워싱턴 레드먼드 MS 본사에서 개발자 회의 ‘빌드 2024′를 열고 이미지 분석이 가능한 소형 거대 언어 모델(sLLM) ‘파이3 비전’을 발표했다. MS는 그동안 협업 관계인 오픈AI의 거대 언어 모델(LLM)인 ‘GPT’를 활용해 인공지능(AI) 서비스를 해왔다. ‘LLM’은 천문학적 용량의 데이터를 학습하고 생성하는 역할을 하는 모델로 생성형 AI 개발의 기반이 된다. 만능 AI로 불리는 ‘GPT’는 생성형 AI가 학습·추론을 할 때 데이터를 서로 연결해 주는 파라미터(parameter·매개변수)가 1조개(GPT4 기준) 정도 된다. 반면 ‘파이3 비전’의 파라미터는 42억개에 불과하다. 파라미터가 적으면 처리하는 데이터 수가 줄어, 제공하는 정보의 양도 적지만, 운영 비용은 크게 낮아진다. MS는 “파이3 비전은 시각 추론 작업, 표나 차트 이해 작업에 특화한 모델”이라며 “비슷한 성능을 지닌 다른 모델 대비 비용은 10분의 1에 그친다”고 밝혔다. 업계 관계자는 “모든 자동차를 스포츠카처럼 고성능으로 만들지 않고, 용도에 따라 경차·소형차·대형차도 생산하듯이, 생성형 AI도 가성비에 맞는 저용량 모델이 나오는 것”이라고 말했다.

거대 언어 모델 개발 질주에 나섰던 빅테크들이 올해 들어 잇따라 sLLM 모델을 내놓으며 생성형 AI 시장 공략에 나서고 있다. sLLM은 말 그대로 소형화하고 경량화한 거대 언어 모델을 말한다. 기본 조 단위 파라미터를 갖는 기존 LLM과 달리 적게는 수십억 개 단위의 파라미터로 운영이 가능해 훈련 시간과 운영 비용, 전력 소모량이 획기적으로 적은 게 특징이다.

조선일보

그래픽=김성규


◇MS·구글·메타까지 ‘sLLM 경쟁’

올해 들어 글로벌 빅테크는 sLLM을 속속 출시하고 있다. MS가 파이3를 내놓은 데 앞서 지난달 메타는 파라미터 80억개의 라마3, 앤스로픽은 방대한 양의 연구 논문 요약에 특화된 클로드3 하이쿠를, 국내 기업 네이버는 하이퍼클로바X 대시를 내놨다. 이들은 공통적으로 파라미터가 수십억 개에 그친다는 특징이 있다. 이 때문에 비용은 훨씬 저렴하고 속도는 빠르다.

조선일보

그래픽=김성규


빅테크들이 sLLM 개발에 뛰어드는 건 수익성 때문이다. LLM은 성능은 좋지만, 개발에 천문학적 비용이 들고, 사용처도 빅테크에 국한된다. 아직은 수익성이 떨어질 수밖에 없다. 하지만 sLLM은 스타트업들도 사용할 수 있게 비용을 낮췄다. 파이낸셜타임스(FT)는 “비싼 비용을 우려하는 일반 기업들이 조금 더 쉽게 AI 도입을 할 수 있도록 하기 위한 빅테크들의 노력”이라며 “LLM을 구축하기 위해 수십억 달러를 쓴 빅테크들이 수익을 내기 위해 sLLM을 속속 내놓고 있다”고 분석했다.

실제 sLLM은 LLM에 비해 비용이 크게 저렴하다. FT에 따르면 100만 토큰(데이터 기본 단위) 기준으로 LLM인 구글의 제미나이 1.5 프로는 7달러, GPT-4o가 5달러의 비용이 든다. 예컨대 한 기업이 빅테크가 개발한 LLM을 활용해 서비스나 앱을 만들 경우, 영 단어 기준 100만개의 답변을 얻을 때마다 이 돈을 빅테크에 지불해야 한다는 뜻이다. 하지만 대부분의 sLLM은 비용이 100만 토큰 기준 1달러 미만이다. 업계 관계자는 “AI 시대에 맞춰 관련 서비스를 만들고 싶어도 막대한 비용 탓에 선뜻 도입을 꺼렸던 기업들 입장에선 싸고 가벼운 sLLM이 입문용으로 도전해볼 만한 것”이라고 말했다.

◇수익성·활용성에 강점

sLLM은 수익성뿐 아니라 활용성 측면에도 강점이 있다. 작고 가볍기 때문에 클라우드(가상 서버)를 거치지 않고 기기 안에서 AI 서비스를 제공하는 온디바이스(내장형) AI를 구현할 수 있다. 실제 삼성전자는 올해 초 첫 AI 스마트폰 갤럭시S24를 내놓으며 구글의 sLLM 모델 ‘제미나이 나노’를 탑재했다. 애플도 올해 아이폰에 AI를 구동하기 위해 자체 sLLM을 개발하고 있는 것으로 알려졌다.

의료·법률·금융 등 각 기업이 필요한 특정 목적에 맞게 맞춤형으로 개발 가능하다는 것도 장점이다. 국내에서는 KT가 기존 2100억개 이상의 파라미터를 가진 LLM ‘믿음’을 70억~400억개 수준으로 경량화해 특정 분야에 제공할 계획이다. 국내 AI 스타트업 업스테이지는 최근 sLLM 솔라미니를 출시했고 리걸테크 스타트업 로앤컴퍼니와 법률에 특화된 서비스를 개발하고 있다.

☞sLLM (소형 거대언어모델)

small Large Language Model의 약자. 오픈AI의 GPT나 구글의 제미나이처럼 방대한 양의 데이터를 학습해 모든 질문에 답하는 거대언어모델(LLM)과 달리 주로 의료·법률·금융 등 분야에 특화돼 성능을 정교하게 끌어올린 AI를 말한다. 처리하는 데이터가 적은 만큼, 훈련 시간과 운영 비용, 전력 소모량 등이 적어 경제적이다.

[이해인 기자]

- Copyrights ⓒ 조선일보 & chosun.com, 무단 전재 및 재배포 금지 -
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.