컨텐츠 바로가기

05.04 (토)

MS, sLM '파이-3' 출시..."38억 매개변수로 GPT-3.5 성능"

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박찬 기자]
AI타임스

(사진=셔터스톡)

<이미지를 클릭하시면 크게 보실 수 있습니다>


마이크로소프트(MS)가 소형언어모델(sLM) '파이-3 미니(Phi-3 Mini)'를 공개했다. 매개변수 38억개로 'GPT-3.5' 성능과 맞먹는다는 설명이다. 이처럼 최근 메타의 '라마 3' 소형 버전 공개에 이어 작고 효율적인 sLM 경쟁이 심화되는 양상이다.

더 버지는 23일(현지시간) MS가 지난해 12월 선보인 '파이-2'의 후속 모델 파이-3''를 공개했다고 보도했다.

파이-3는 매개변수 38억개인 '미니'와 70억 개의 '스몰', 140억 개인 '미디엄' 3가지 버전으로 공개된다. MS는 그 중 최소형인 파이-3 미니를 우선 선보였다. 파이-3 미니는 이날 애저 AI 모델 카탈로그, 허깅 페이스, 엔비디아 NIM 등 각종 소프트웨어 플랫폼에 출시됐다.

MS는 파이-3 시리즈가 "이제까지 등장한 sLM 중 가장 유능하고 비용 면에서 효율적"이라고 소개했다. 파이-3는 지난해 12월 출시된 파이-2보다 성능이 개선됐을 뿐만 아니라, 이보다 10배 큰 모델 수준의 성능을 제공할 수 있다고 강조했다.

에릭 보이드 MS 애저 AI 플랫폼 부사장은 "파이-3 미니의 경우 오픈AI의 대형언어모델(LLM)인 GPT-3.5와 같은 수준의 성능을 발휘한다"라고 말했다.

MS는 또 sLM이 단순 작업을 수행할 수 있도록 설계, 한정된 자원을 가진 기업이 더 쉽게 사용할 수 있고, 비용도 상당히 저렴하다고 강조했다.

세바스티엔 부벡 MS 생성 AI 연구담당 부사장은 "파이-3는 비슷한 성능을 지닌 타 모델들과 비교하면 비용이 10분의 1에 불과하다"라며 "이를 통해 획기적인 비용 감소가 가능하다"라고 말했다.

이는 MS가 지난해 하반기부터 오픈AI의 GPT-4를 대신할 자체 sLM 개발에 초점을 맞춘 결과다.

즉 오픈AI의 LLM과 함께 sLM 시장까지 공략하는 셈이다. 이는 많은 매개변수를 투입해 만든 LLM이 가동 비용이 높다는 문제를 해결하기 위한 전략이다. 특히 인터넷 연결 없이도 AI 연산을 수행하는 엣지 AI 기기가 늘어나며 저전력·고효율 AI 모델의 필요성은 더 높아지고 있다.

루이스 바르가스 MS AI 부문 부사장은 "일부 고객은 소형 모델만 필요로 할 수 있고, 일부는 대형 모델만 필요로 할 수 있다"라며 "하지만 많은 기업은 두가지 모두 합쳐 여러 방식으로 활용할 수 있을 것"이라고 내다봤다.

이에 따라 sLM 경쟁도 치열해진지 꽤 됐다.

지난 2월 구글은 간단한 챗봇 구동과 언어 관련 작업에 특화된 경량 모델 '젬마 2B'와 '7B'를 출시했으며, 앤트로픽은 지난 3월 방대한 양의 연구 논문 등을 빠르게 요약해주는 '클로드 3 하이쿠' 모델을 출시했다.

메타 역시 지난 18일 '라마 3'를 출시하면서 매개변수 80억개(8B)의 소형 모델을 선보인 바 있다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.