ⓒ Getty Images Bank |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
AWS는 이미 앤트로픽의 주요 클라우드 서비스 업체다. 앞으로 앤트로픽은 트레이니움 및 인페렌시아(Inferentia) 칩을 활용하여 기초 모델을 훈련하고 배포할 계획이다. 또한 앤트로픽은 ‘하드웨어-소프트웨어 개발 접근 방식(hardware-software development approach)’을 통해 트레이니움 개발에도 협력할 예정이다.
이번 협약으로 앤트로픽이 AWS 칩을 독점적으로 사용해야 하는지는 확실하지 않지만, AI 칩 경쟁이 가속화하는 가운데 아마존이 엔비디아 및 기타 지배적인 업체에 도전하기 위한 움직임인 것은 분명하다.
포레스터 수석 애널리스트 앨빈 응우옌은 “이번 협력은 생성형 AI와 AI 모델의 접근성을 확대하기 위한 첫걸음”이라고 평가했다.
클로드 발전 가속화
2021년 설립된 앤트로픽은 올해 클로드 LLM을 통해 오픈AI와 경쟁하며 큰 진전을 이뤘다. 클로드 3 모델군은 소네트(Sonnet), 하이쿠(Haiku, 가장 빠르고 컴팩트한 모델), 오퍼스(Opus, 복잡한 작업에 적합한 모델)로 구성되며, 모두 아마존 베드락(Amazon Bedrock)에서 사용할 수 있다. 이들 모델은 비전 기능과 20만 개의 토큰 컨텍스트 창을 갖추고 있어 약 15만 단어 또는 500페이지 분량의 데이터를 처리할 수 있다.특히 지난 10월 앤트로픽은 클로드 3.5 소네트 모델에 “컴퓨터 사용” 기능을 추가했다. 이 기능을 통해 모델은 사람처럼 컴퓨터를 사용할 수 있으며, 마우스 커서 이동, 탭 전환, 웹사이트 탐색, 버튼 클릭, 연구 문서 컴파일 등의 작업을 빠르게 수행할 수 있다. 앤트로픽은 소네트 모델이 에이전틱 코딩 작업에서 현재 사용 가능한 다른 모든 모델을 능가한다고 주장한다.
AWS에 따르면, 지난 2023년 4월 생성형 AI 모델 구축을 위한 완전 관리형 서비스인 아마존 베드락에 클로드가 추가된 이후 도입이 빠르게 확산했다. 현재 다양한 산업에 걸친 기업 “수만” 곳에서 사용하고 있다. 이 파운데이션 모델은 챗봇, 코딩 어시스턴트, 복잡한 비즈니스 프로세스 등 다양한 기능 구축에 활용된다.
앤트로픽의 공동 창립자 겸 CEO 다리오 아모데이는 발표문에서 “2024년은 클로드가 비약적으로 성장한 해였으며, 아마존과의 협력은 클로드의 기능을 아마존 베드락을 통해 수백만 명의 최종 사용자에게 제공하는 데 중요한 역할을 했다”라고 말했다.
이번 협력 확대는 양사 모두에 전략적으로 중요한 의미를 지닌다. 앤트로픽의 모델이 높은 성능과 다재다능함을 갖추고 있음을 보여주며, AWS의 인프라가 엔비디아 등 다른 칩 제조사와 경쟁할 수 있을 만큼 강력한 생성형 AI 워크로드를 처리할 수 있음을 시사한다.
포레스터의 응우옌에 따르면, 이번 협력을 통해 앤트로픽은 “인프라를 보장하고 모델 기능을 지속해서 확장하고 선보일 수 있는 능력”을 확보할 수 있으며, 앤트로픽의 입지와 접근성 확장에도 도움이 된다.
응우옌은 “이 협력은 앤트로픽이 다양한 파트너와 효과적으로 협력할 수 있음을 보여준다. 이는 훈련, 모델 생산 및 활용 능력에 대한 신뢰도를 높인다. AWS는 앤트로픽과의 협력을 통해 “AI 분야의 대표적인 고객을 확보했다”라고 평가했다.
모델 훈련의 모든 측면 최적화
협력 확대의 일환으로 앤트로픽은 AWS의 맞춤형 ML 칩인 트레이니움의 향후 버전 개발 및 최적화에 참여할 예정이다. 트레이니움은 1,000억 개 이상의 매개변수를 가진 모델에 대한 딥러닝 학습을 지원한다.
앤트로픽은 AWS의 안나푸르나 랩(Annapurna Labs)와 긴밀히 협력해 트레이니움 실리콘과 상호작용할 수 있는 저수준 커널을 작성하고 있다고 밝혔다. 또한 트레이니움을 강화하기 위해 AWS 뉴런(Neuron) 소프트웨어 스택에 기여하고 있으며, 칩 설계팀과 하드웨어 계산 효율성을 향상시키는 데 협력하고 있다.
앤트로픽은 블로그 게시물에서 “긴밀한 하드웨어-소프트웨어 공동 개발 접근 방식과 트레이니움 플랫폼의 강력한 가격 대비 성능 및 대규모 확장성을 결합해 실리콘부터 전체 스택에 이르기까지 모델 훈련의 모든 측면을 최적화할 수 있다”라고 말했다.
포레스터의 응우옌은 “이런 접근 방식은 절대적으로 필요한 것 이상을 수행하는 엔비디아 GPU 같은 범용 하드웨어에 비해 이점을 제공한다. 또한 양사의 오랜 협력 관계는 엔비디아 CUDA 플랫폼이 제공하는 성능 최적화 우위를 어느 정도 상쇄할 가능성이 있다”라고 강조했다.
응우옌은 “소프트웨어와 하드웨어 엔지니어 및 개발자 간의 깊이 있는 협력을 통해 독립적으로 작업할 때는 어려운 수준의 최적화를 하드웨어와 소프트웨어 모든 측면에서 실현할 수 있다”라고 덧붙였다.
editor@itworld.co.kr
Taryn Plumb editor@itworld.co.kr
저작권자 한국IDG & ITWorld, 무단 전재 및 재배포 금지
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.