[박찬 기자]
미스트랄이 개발자 중심의 언어모델 시리즈 '데브스트랄(Devstral)'의 업그레이드 버전을 공개했다. 이번 출시는 코드 생성, 수정, 디버깅 등 실전 소프트웨어 개발 워크플로우에 최적화된 AI 모델로, 고성능과 비용 효율성을 동시에 갖췄다는 평가를 받고 있다.
미스트랄은 13일(현지시간) 스타트업 오픈핸즈 AI와 협력해 데브스트랄 시리즈의 최신 버전 오픈 소스 모델 '데브스트랄 스몰 1.1(devstral-small-2507)' 상용 고성능 모델 '데브스트랄 미디엄 2507(devstral-medium-2507)'을 발표했다.
이 시리즈는 대규모 코드 저장소 기반의 자동화된 소프트웨어 개발을 목표로 설계됐다.
![]() |
(사진=셔터스톡) |
미스트랄이 개발자 중심의 언어모델 시리즈 '데브스트랄(Devstral)'의 업그레이드 버전을 공개했다. 이번 출시는 코드 생성, 수정, 디버깅 등 실전 소프트웨어 개발 워크플로우에 최적화된 AI 모델로, 고성능과 비용 효율성을 동시에 갖췄다는 평가를 받고 있다.
미스트랄은 13일(현지시간) 스타트업 오픈핸즈 AI와 협력해 데브스트랄 시리즈의 최신 버전 오픈 소스 모델 '데브스트랄 스몰 1.1(devstral-small-2507)' 상용 고성능 모델 '데브스트랄 미디엄 2507(devstral-medium-2507)'을 발표했다.
이 시리즈는 대규모 코드 저장소 기반의 자동화된 소프트웨어 개발을 목표로 설계됐다.
우선 데브스트랄 스몰 1.1은 약 240억 매개변수를 갖춘 경량 모델로, 최대 12만8000 토큰의 문맥 길이를 지원한다. XML 및 함수 호출 형식의 구조화된 출력에 특화돼 있으며, 오픈핸즈 프레임워크와의 높은 호환성을 제공한다. 허깅페이스에 공개돼, 누구나 자유롭게 활용하고 커스터마이징할 수 있다.
벤치마크 결과, 'SWE-벤치 베리파이드'에서 53.6% 정확도를 기록, 이전 버전보다 성능이 크게 향상됐다. 이는 비슷한 규모의 오픈 모델 중 최고 수준이다. 특히 로컬 환경에서도 구동 가능하도록 GGUF 포맷으로도 제공되며, 'RTX 4090' GPU나 애플 실리콘에 최적화됐다.
데브스트랄 미디엄 2507은 상업용 API를 통해 제공되는 고성능 모델이다. 같은 12만8000 컨텍스트를 지원하면서도, SWE-벤치 베리파이드 기준 61.6%의 정확도를 달성해 '제미나이 2.5 프로'와 'GPT-4.1'을 능가했다.
고난도 코드 리팩토링이나 버그 수정 등 대규모 코드베이스 작업에 특화돼 있으며, 기업을 위한 온프레미스 배포와 미세조정도 지원한다.
![]() |
가격도 경쟁력이 있다. 데브스트랄 스몰은 입력 토큰 100만개당 0.10달러, 출력 토큰 100만개당 0.30달러로 책정됐으며, 데브스트랄 미디엄은 입력 토큰 100만개당 0.40달러, 출력 토큰 100만개당 2.00달러로 제공된다.
두 모델 모두 오픈핸즈 기반의 에이전트 프레임워크에 최적화돼 있어, 자동화된 테스트 생성, PR 분류, 코드 검색 및 수정을 위한 통합 워크플로우 구현에 적합하다.
예를 들어, 데브스트랄 스몰은 로컬 프로토타입 개발이나 통합개발환경(IDE) 플러그인에 적합하다. 데브스트랄 미디엄은 서비스 환경에서 코드 리뷰 자동화나 배포 전 검토 작업 등에 활용될 수 있다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.