컨텐츠 바로가기

11.26 (화)

이슈 인공지능 시대가 열린다

네이버 '하이퍼클로바X' 기술평가 공개…"토종 AI 모범사례"

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
연합뉴스

네이버 하이퍼클로바X 기술 보고서



(서울=연합뉴스) 홍국기 기자 = 네이버가 자사의 인공지능(AI) 거대언어모델(LLM)인 '하이퍼클로바X'에 대한 기술 보고서를 공개했다.

4일 네이버가 작성한 보고서를 보면 하이퍼클로바X는 한국어, 일반 상식, 수학, 코딩 부문에서 비교·평가를 위해 선정한 14개 모델 가운데 1위를 기록했다.

한국어 능력 부문에서는 세계 최고 수준 모델을 포함해 비교·평가를 위해 보고서에서 선정한 4개 모델 중 1위에 올랐고, 영어 능력 분야에서도 같은 모델들 가운데 2위로 평가됐다.

하이퍼클로바X의 사전학습(Pretraining) 데이터는 대부분 한국어, 영어, 코드 데이터로 구성됐다.

양질의 사전학습 데이터 구축을 위해 매우 짧거나 반복적인 저품질 문서는 데이터세트에서 제외했고, 개인 정보가 포함된 데이터도 삭제했다.

또 사용자의 의도와 지시를 AI가 더 잘 이해할 수 있도록 모델을 고도화했다.

보고서에서 강조한 하이퍼클로바X의 또 다른 특징은 '다국어 능력'(Multilinguality)이다.

학습 데이터의 대부분을 차지하는 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 갖춘 것이 확인됐다고 네이버는 소개했다.

한국어를 일본어로, 일본어를 한국어로 번역하는 능력은 보고서에서 선정한 10개의 모델 가운데 1위로 평가됐고, 영어를 한국어로 번역하는 정확도 역시 동일한 10개 모델 중 가장 높은 점수를 기록했다.

네이버클라우드 유강민 팀장(리더)은 "하이퍼클로바X의 다국어 추론, 기계 번역 능력을 측정한 실험은 지역 또는 문화권 특화 목적으로 개발한 AI가 해당 국가 언어 외에도 여러 언어에서 일정 수준 이상의 능력을 갖출 수 있음을 실증한 것"이라며 "특정 문화권에 더 적합한 배경지식과 함께 다국어 능력까지 보유해 한층 활용도가 높은 소버린 AI의 가능성을 하이퍼클로바X가 보여주고 있다"고 설명했다.

네이버클라우드 하이퍼스케일 AI 성낙호 기술 총괄은 "한국 특화 지식뿐 아니라 프로그래밍과 수학적 추론, 다국어 능력과 안전성까지 확보한 소버린(Sovereign·주권) AI의 '모범 사례'"라고 강조했다.

redflag@yna.co.kr

▶제보는 카카오톡 okjebo
▶연합뉴스 앱 지금 바로 다운받기~
▶네이버 연합뉴스 채널 구독하기
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.