<이미지를 클릭하시면 크게 보실 수 있습니다> |
인공지능(AI) 스타트업 라이터가 지식 전달보다 복잡한 기업 워크플로우를 자동화하는 데 초점을 맞춘 AI 에이전트 특화 모델을 출시했다.
벤처비트는 9일(현지시간) 라이터가 AI 애플리케이션과 자율 에이전트를 지원하기 위해 설계된 새로운 대형언어모델(LLM) '팔미라 X 004(Palmyra X 004)'를 출시했다고 보도했다.
라이터는 새로운 모델을 훈련하기 위해 합성 데이터를 사용했으며, 이를 통해 경쟁사들에 비해 훨씬 적은 비용으로 LLM을 제작할 수 있었다고 밝혔다. 특화된 LLM인 '인스트럭트-어댑트 X(nstruct-Adapt X)'를 통해 자체적으로 구조화된 데이터셋을 선별하고 생성한다. 또 자체 개발한 '조기 중단(early stopping) 메커니즘'이라는 기준을 사용해 더 작은 데이터셋으로도 높은 성능을 달성했다고 설명했다.
팔미라 X 004는 자동 데이터 통합과 검색 증강 생성(RAG) 기능을 포함한 여러 새로운 기능을 제공한다. 이를 통해 기업 사용자는 실시간 데이터를 활용해 모델의 정확성을 향상할 수 있다.
특히 도구 호출 기능을 통해 LLM 외부 시스템에서도 작업을 수행할 수 있다는 것이 차별점이다. 이는 데이터 분석과 텍스트 생성 이상의 작업으로 확장될 수 있음을 의미한다.
팔미라 X의 도구 사용 기능은 AI 어시스턴트와 에이전트가 사용자 요청에 따라 이벤트를 트리거하고, 데이터를 가져오며, 다양한 작업을 수행하도록 맞춤화할 수 있게 해준다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
이를 통해 최소한의 인간 개입으로 작업을 수행할 수 있게 해, AI 에이전트가 복잡한 작업 체인을 실행하도록 한다. 예를 들어, AI 에이전트는 월말 보고서를 분석하고 인사이트가 포함된 요약을 작성하며 관련 부서장에게 보낼 이메일을 준비하고 지정된 날짜에 자동으로 발송하는 등 매달 최소한의 직원 상호작용만으로 이런 작업을 처리할 수 있다.
기반 모델을 평가하는 HELM 라이트(Lite)와 57개 과목에 대한 모델 이해도를 테스트하는 HELM MMLU에서 각각 86.1%와 81.3%의 점수를 기록, 세계 상위 10대 모델에 이름을 올렸다.
특히 도구 호출 작업에서 뛰어난 성능으로 차별화된다. 이 모델은 버클리대학교의 도구 호출 리더보드에서 78.76%의 점수를 기록, 오픈AI와 앤트로픽, 구글, 메타 등의 모델을 약 20% 초과했다.
이 벤치마크는 모델이 적절한 도구를 선택하고 호출할 API를 결정하며 자연어 입력에 기반하여 작업을 성공적으로 실행하는 능력을 평가한다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.