[김지연 기자] [포인트경제] 네이버클라우드가 독자 개발한 경량화 추론모델 'HyperCLOVA X SEED 14B Think'를 상업용 무료 오픈소스로 공개했다. 해당 모델은 해외 상용 오픈소스 모델을 개조한 것이 아니라, 원천기술을 바탕으로 추론 능력과 경량화 기술을 결합해 개발한 AI다. 이를 통해 국내 AI 역량 강화와 생태계 확장에 기여한다.
HyperCLOVA X SEED 14B Think는 지난달 30일 발표된 추론모델 HyperCLOVA X THINK를 안정적이고 비용 효율적으로 서비스에 접목할 수 있도록 경량화한 모델이다. 중요도가 낮은 파라미터를 가지치기(pruning)해 원본 모델의 지식을 최대한 보존하는 한편, 가지치기 과정에서 손실된 큰 모델의 지식을 작은 모델에 전이(distillation)하는 학습 방식을 적용해 학습 비용을 크게 낮췄다.
네이버클라우드 측에 따르면, 140억 개 파라미터 규모임에도 5억 개 파라미터로 구성된 글로벌 오픈소스 모델보다 적은 GPU 사용 시간으로 학습됐다. 동일 크기 글로벌 오픈소스 모델과 비교하면 1회 학습 비용은 약 100분의 1 수준이다.
HyperCLOVA X SEED 14B Think는 지난달 30일 발표된 추론모델 HyperCLOVA X THINK를 안정적이고 비용 효율적으로 서비스에 접목할 수 있도록 경량화한 모델이다. 중요도가 낮은 파라미터를 가지치기(pruning)해 원본 모델의 지식을 최대한 보존하는 한편, 가지치기 과정에서 손실된 큰 모델의 지식을 작은 모델에 전이(distillation)하는 학습 방식을 적용해 학습 비용을 크게 낮췄다.
네이버클라우드 측에 따르면, 140억 개 파라미터 규모임에도 5억 개 파라미터로 구성된 글로벌 오픈소스 모델보다 적은 GPU 사용 시간으로 학습됐다. 동일 크기 글로벌 오픈소스 모델과 비교하면 1회 학습 비용은 약 100분의 1 수준이다.
이 모델은 한국어·한국문화, 코딩·수학 관련 성능 평가에서 140억 개 파라미터 모델 또는 320억 개 파라미터 모델과 유사하거나 더 높은 평균 점수를 기록했다. 이를 통해 비용과 규모 대비 뛰어난 성능을 갖춘 AI 모델을 구축할 수 있는 독자 기술력을 입증했다.
네이버클라우드 하이퍼스케일 AI 성낙호 기술 총괄은 "독자 기술로 생성형 AI 모델을 꾸준히 업그레이드하며 구축한 고성능 플래그십 모델과 다수의 실험 및 개선을 거친 효율적 학습 전략을 바탕으로 동일 규모에서 비용과 성능이 더 효과적인 추론모델을 구축할 수 있었다"고 밝혔다. 이어 "해외 상용 모델을 개조한 기술로 생태계에 편입되기보다 토대부터 자체 기술로 구축한 하이퍼클로바X가 국내 AI 생태계의 본격적 성장을 이끌 것"이라고 말했다.
한편, 지난 4월 오픈소스로 공개된 하이퍼클로바X 경량모델 3종은 7월 누적 다운로드 100만 건을 돌파했다. 50여 개 1차 파생모델을 기반으로 새로운 파생모델이 생산·공유되고, 한국어 온 디바이스 AI 서비스가 출시되는 등 국내외에서 기술력과 비즈니스 활용성을 인정받으며 하이퍼클로바X 오픈소스 생태계가 빠르게 확장되고 있다.
<저작권자 Copyright ⓒ 포인트경제 무단전재 및 재배포 금지>
