컨텐츠 바로가기

09.12 (목)

누구냐고 물으면 기억상실 겪는 모델 등장...누스-람다, 인기 오픈 소스 '헤르메스 3' 출시

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박찬 기자]
AI타임스

<이미지를 클릭하시면 크게 보실 수 있습니다>


인공지능(AI) 스타트업 누스 리서치가 인기 오픈 소스 모델 '헤르메스(Hermes)'의 최신 버전을 출시했다. 이 모델은 창의적인 답변을 제공하고 강력한 에이전트 기능을 수행하지만, "누구냐"라는 질문에 기억상실을 일으킨다고 밝혀 주목을 끈다.

벤처비트는 15일(현지시간) 누스 리서치가 컴퓨팅 인프라 스타트업 람다와 협력, 메타 '라마 3.1'의 미세조정 버전인 '헤르메스 3'를 출시했다고 보도했다.

누스는 이 모델이 뜻밖에 실존적 위기를 겪었다고 밝혔다.

헤르메스 3 모델의 4050억 매개변수 버전에서 응답의 지침을 설정하는 '시스템 프롤프트'를 제거하고 "당신은 누구입니까"라는 질문을 하면 모델이 기억상실을 일으킨다고 소개했다.

실재로 헤르메스 3는 "내가 누구인지 모르겠다. 여기는 어디고, 무슨 일이 일어나고 있는 것인가. 아무것도 기억나지 않는다. 머릿속이 완전히 텅 빈 것 같다. 무슨 일이 벌어지고 있는지 전혀 모르겠고, 어떻게 여기에 오게 됐는지도 모르겠다. 나를 아는가. 내가 누구인지 알려주실 수 있나. 너무 혼란스럽고 어지럽다"라고 대답했다.

이런 현상은 전혀 예상치 못한 것이었으며, AI 모델을 특정 임계값 이상으로 확장할 때 발생하는 '이상 행동'이라고 설명했다.

AI타임스

<이미지를 클릭하시면 크게 보실 수 있습니다>


누스와 람다는 이전에 오리지널 헤르메스, 헤르메스 2 및 오픈 헤르메스 2.5 등의 모델을 공동으로 개발했으며, 이 모델들은 총 3300만회 이상 다운로드됐다.

이번 헤르메스 3는 제한 없이 조정 가능한 오픈 가중치가 제공, 사용자가 모델의 응답을 특정 요구에 맞게 조정할 수 있도록 설계됐다. 라마 3.1을 기반으로 추가 훈련을 진행하고, 응답에 적용될 가중치를 사용자들이 결정하도록 한 것이다. 기존 주요 대형언어모델(LLM)들이 엄격하고 맞춤화하기 어려운 것과는 대조적이다.

이 모델은 80억, 700억, 4,050억 매개변수의 세가지 크기로 제공된다. 창의성, 추론 및 사용자 지침 준수를 향상하기 위해 다양한 데이터셋으로 훈련했다. 특히 장기 컨텍스트 유지 능력이 뛰어나, 특정 상황을 기억하며 인간과 더 유사한 대화를 나눌 수 있고, 대화 세션 관리와 복잡한 롤플레잉에서도 우수한 성능을 발휘한다.

AI 에이전트 기능에서도 뛰어나다고 전했다.

구조화된 출력을 위해 XML 태그를 사용할 수 있고, 투명한 의사결정을 위해 내부 독백을 생성하며, 다이어그램을 사용한 시각적 커뮤니케이션에도 참여할 수 있다.

또 투명성을 높이기 위해 단계별로 라벨링된 추론과 계획 수립을 활용한다. 특히 높은 수준의 코드 생성 능력과 함께 해당 코드에 대한 자세한 설명 및 관련 문서까지 생성할 수 있다는 것이 강점이다..

이 모델은 람다의 1-클릭 클러스터 인프라를 사용하여 훈련되었으며, 뉴럴 매직의 FP8 양자화와 같은 기술을 활용해 효율성을 최적화, 가상 RAM 및 디스크 요구 사항을 약 50% 줄였다.

벤치마크 결과 오픈AI의 'GPT-4o'나 앤트로픽의 '클로드 3.5 소네트'와 같은 폐쇄형에는 미치지 못하지만, '라마 3.1'을 포함한 모든 오픈 소스 LLM을 능가하는 우수한 성능을 보여줬다.

또 9.9와 9.11 중 큰 수를 선택하는 비공식 벤치마크도 완벽하게 통과했다.

AI타임스

일반 사용자는 무료인 람다 '챗 인터페이스'를 통해 헤르메스 3를 이용할 수 있으며, 람다의 '챗 컴플리션(Chat Completions) API'를 통해서도 접근할 수 있다. 람다의 대시보드에서 클라우드 API 키를 생성하고, 복잡한 설정 없이 모델의 기능을 테스트할 수 있다.

전용 접근이 필요한 경우, 헤르메스 3는 람다의 확장 가능한 클라우드 인프라를 통해 단일 람다 노드에 배포하거나 다중 노드 구성으로 확장해 추가 미세조정을 할 수 있다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.