컨텐츠 바로가기

04.28 (일)

앤트로픽 '클로드3', 블라인드 테스트서 GPT-4 능가

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[AI리포터]
디지털투데이

[사진: 클로드 AI(Claude AI)]

<이미지를 클릭하시면 크게 보실 수 있습니다>


[디지털투데이 AI리포터] 앤트로픽의 대규모언어모델(LLM) '클로드3' 가운데 오푸스 모델이 LLM 블라인드 테스트인 LMSYS 챗봇 아레나 랭킹에서 1위를 차지했다. 오픈AI의 GPT-4를 밀어낸 결과다.

28일(현지시간) 대만 IT홈에 따르면 LMSYS 챗봇 아레나는 Elo 채점 시스템을 사용해 참가자의 상대적 기술을 계산하는 플랫폼이다. 원래는 체스의 채점 시스템을 개선하기 위해 개발됐으나 이후 축구, 야구, 농구, 다양한 보드게임에서 최근에는 LLM에까지 적용되기 시작했다.

지난해 5월 공개된 LMSYS 챗봇 아레나 랭킹에서 1위는 GPT가 차지했으나, 올해는 클로드3 오푸스가 이를 꿰찼다. 뒤를 이어 GPT-4-1106-프리뷰와 GPT-4-0125-프리뷰가 각각 2, 3위에 올랐다.

한편, 클로드3 시리즈는 3월 초에 출시된 모델로 최저가형 클로드3 하이쿠, 중급 클로드3 소네트, 가장 강력한 클로드3 오푸스가 있다.

<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.