경량화 기술로 비용 100분의 1 절감
상업용도 무료 개방, AI 에이전트 기반 확장 기대
상업용도 무료 개방, AI 에이전트 기반 확장 기대
[이데일리 김현아 기자] 네이버클라우드(대표 김유원)가 자사 독자 기술로 개발한 추론(reasoning) AI 모델 ‘HyperCLOVA X SEED 14B Think’를 상업적 용도까지 포함한 오픈소스로 22일 전격 공개했다.
지난 4월 공개된 하이퍼클로바X 경량 모델 3종에 이어 이번에는 추론 특화 대형 모델까지 오픈 생태계로 확장한 것이다.
이번에 공개된 모델은 상용 오픈소스 모델을 개조한 것이 아닌, 기초부터 자체 개발한 원천 기술 기반의 경량화 모델이다.
지난 4월 공개된 하이퍼클로바X 경량 모델 3종에 이어 이번에는 추론 특화 대형 모델까지 오픈 생태계로 확장한 것이다.
이번에 공개된 모델은 상용 오픈소스 모델을 개조한 것이 아닌, 기초부터 자체 개발한 원천 기술 기반의 경량화 모델이다.
특히 복잡한 추론 기능과 서비스 적용을 동시에 가능케 하는 구조로 설계됐으며, 해외 대형 모델과 유사한 성능을 훨씬 낮은 비용으로 구현한 것이 강점이다.
주요 모델별 학습비용 비교. 출처=네이버클라우드 |
학습 비용 100분의 1… “성능은 동일, 효율은 압도적”
‘HyperCLOVA X SEED 14B Think’는 지난달 발표된 추론 모델 ‘HyperCLOVA X THINK’의 경량화 버전으로, 불필요한 파라미터를 제거(프루닝)하고, 손실된 성능은 지식 증류(distillation) 방식으로 보완해 학습 비용을 대폭 줄였다.
모델의 크기는 140억 파라미터(매개변수)수준이지만, 5억 파라미터 규모의 글로벌 오픈소스 모델보다도 더 적은 GPU 자원(GPU hours)으로 학습되었으며, 동일 크기 해외 모델과 비교하면 학습 비용이 약 100분의 1 수준이라는 게 회사 측 설명이다.
실제 한국어·코딩·수학 등 다양한 벤치마크(KMMLU, KoBALT, MATH500, HumanEval 등) 평가에서 동일 크기 또는 더 큰 모델(320억 파라미터)과도 유사하거나 더 높은 평균 점수를 기록한 것으로 나타났다.
AI 에이전트 기술도 상업적 활용 가능… “생태계 기여 의지 담았다”
이번 모델은 단순한 기술 공개를 넘어 AI 에이전트 기반 서비스 구축을 위한 핵심 모듈로도 사용될 수 있다. 네이버클라우드는 이번 오픈소스 공개를 통해 AI 기술을 연구용에만 국한하지 않고, 산업 전반에서 실질적으로 활용할 수 있도록 기회를 넓혔다고 강조했다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술총괄은 “토대부터 독자 기술로 개발한 고성능 AI 모델과, 수많은 실험으로 축적한 학습 전략을 바탕으로 비용과 성능 효율을 동시에 충족시키는 추론모델을 만들었다”며 “글로벌 생태계에 편입되기보다는 한국형 AI 생태계를 독자적으로 구축하고 이끌겠다는 의미”라고 설명했다.
하이퍼클로바X, 오픈소스 생태계로 진화 중… 누적 다운로드 100만 건 돌파
한편, 네이버클라우드가 지난 4월 공개한 하이퍼클로바X 경량 모델 3종은 7월 기준 누적 다운로드 수 100만 건을 돌파했다. 50개 이상의 파생 모델이 생성·공유되고 있으며, 한국어 기반 온디바이스 AI 서비스 상용화도 이어지며 국내외에서 높은 활용성을 인정받고 있다.
네이버클라우드의 AI 개방 전략은 기술 독립성 확보, 비용 절감, 상업용 무료 공개, AI 생태계 기여의 의미가 있다.
해당 모델은 현재 Hugging Face(허깅페이스) 플랫폼에 공개되어 있으며, 누구나 자유롭게 다운로드 및 실험에 활용할 수 있다.
평가 벤치마크는 KMMLU, KoBALT, HAERAE, MATH500, HumanEval, MBPP, LiveCodeBench 등이다.
