[AI리포터]
[디지털투데이 AI리포터] 구글이 지난 3월 연구진에게만 공유됐던 메타의 대규모 언어 모델 '라마'(LLaMA)가 갑작스럽게 외부에 유출된 것에 대해 언급했다.
8일 IT매체 기가진에 따르면 구글은 라마가 많은 사람들에게 확산되면서 기술 개발 속도가 폭발적으로 증가했다고 주장했다.
실제로 라마 유출 이후 쉐어GPT(ShareGPT)와 라마를 통해 훈련된 오픈소스 대규모 언어 모델 '비쿠나-13B'(Vicuna-13B)가 공개돼 라마를 능가하는 성능을 보였다. 다양한 AI 챗봇 품질 평가에서 챗GPT의 응답 품질을 100%로 설정했을 때 라마는 68%을 기록했으나 비쿠나-13B의 품질은 92%에 가까웠다.
메타 [사진: 셔터스톡] |
[디지털투데이 AI리포터] 구글이 지난 3월 연구진에게만 공유됐던 메타의 대규모 언어 모델 '라마'(LLaMA)가 갑작스럽게 외부에 유출된 것에 대해 언급했다.
8일 IT매체 기가진에 따르면 구글은 라마가 많은 사람들에게 확산되면서 기술 개발 속도가 폭발적으로 증가했다고 주장했다.
실제로 라마 유출 이후 쉐어GPT(ShareGPT)와 라마를 통해 훈련된 오픈소스 대규모 언어 모델 '비쿠나-13B'(Vicuna-13B)가 공개돼 라마를 능가하는 성능을 보였다. 다양한 AI 챗봇 품질 평가에서 챗GPT의 응답 품질을 100%로 설정했을 때 라마는 68%을 기록했으나 비쿠나-13B의 품질은 92%에 가까웠다.
이같은 오픈소스 대규모 언어 모델의 공개는 이미지 생성 AI 분야에서 더욱 큰 영향을 미친다. 오픈소스 모델을 채택한 이미지 생성 AI 도구인 스테이블 디퓨전(Stable Diffusion)은 제품 통합, 마켓플레이스, 사용자 인터페이스 등 혁신적인 기술을 개발했으나 오픈소스 모델을 채택하지 않은 오픈AI의 달리(Dall-E)는 그러지 못했다는 지적이다.
이러한 추세에서 구글은 기술을 오픈할 것인가, 말 것인가하는 '오픈 소스 채택 여부'에 대한 고민이 더욱 커졌다는 설명이다. 최근 대규모 언어 모델을 저렴한 가격으로 이용 가능해지면서 기술적 경쟁 우위를 유지하는 것은 더욱 어려워지고 있다.
라마의 데이터가 유출됐던 메타에 대해 구글은 "역설적이게도 메타가 이 상황에서 분명한 승자다"라고 주장했다. 데이터가 유출됐음에도 오픈소스 혁신으로 인해 메타가 제품에 직접 기술을 통합할 수 있게 됐기 때문이다.
구글은 오픈AI에 대해서는 "오픈소스에 대한 자세에서 구글과 같은 실수를 범하고 있다"고 지적했다. 구글이 오픈소스를 채택함으로써 선수를 칠 수 있다는 주장이다. 또 오픈소스 커뮤니티에서 협력함으로써 주도권을 잡아야 한다고 강조했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
