구글 AI 챗봇 '바드'의 성능이 오픈AI의GPT-4 일부 모델보다 우위에 섰다. [사진: 오픈AI, 구글] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] LMSYS 조직(Large Model Systems Org)에서 만든 거대언어모델(LLM) 벤치마크 플랫폼에서 구글의 인공지능(AI) 챗봇 '바드'가 오픈AI의 GPT-4 일부 모델을 제치고 2위를 차지했다고 29일(현지시간) 온라인 매체 기가진이 전했다.
LMSYS 조직은 캘리포니아대학교의 버클리 캠퍼스와 샌디에이고 캠퍼스, 카네기멜론대학교가 공동으로 설립한 연구 조직이다. 이 조직은 대규모 머신러닝 모델과 평가 툴을 개발하고 있다. 그 중 하나가 LLM 벤치마크 플랫폼인 챗봇 아레나(Chatbot Arena)다.
챗봇 아레나는 인간 사용자를 오픈 채팅에 초대해 AI 모델 2가지와 대화를 나눈 후 투표를 통해 순위를 매기는 방식으로 진행된다.
2024년 1월 말 시행된 최근 챗봇 아레나의 순위는 1위가 오픈AI의 GPT-4 터보, 2위가 구글의 바드, 3위가 오픈AI의 GPT-4 버전 0314다. 4위는 오픈AI의 GPT-4 버전 0613으로 오픈AI의 모델이 대부분 상위권을 차지했다.
오픈AI의 GPT-4 모델들이 돋보이는 가운데, 연구진은 GPT-4의 일부 모델을 제치고 2위를 차지한 구글의 바드에 주목했다. 이번 챗봇 아레나에 참여한 바드는 구글이 개발한 멀티모달 AI인 제미니 프로(Gemini Pro)를 기반으로 한다.
LMSYS 조직은 "구글의 바드가 GPT-4를 뛰어넘어 2위에 오르는 쾌거를 이루었다"며 "구글의 위대한 업적에 큰 박수를 보낸다"고 전했다. 이어 연구진은 "이번 결과에 따라 향후 출시 예정인 제미니 울트라(Gemini Ultra) 기반의 바드에 대한 결과도 기대된다"고 말했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.