양사 '클라우드-칩-모델' 협력 강화
트레이니움2 64개 연결한 '울트라 서버'서
클로드 3.5 하이쿠 저지연 모델 제공 예정
클로드 신모델, AWS '레이니어' 프로젝트 통해 학습중
AWS의 연례 최대 기술 콘퍼런스 ‘AWS 리인벤트 2024’가 2일(현지시간) 미국 네바다주 라스베이거스에서 총 닷새간 일정의 막을 올렸다. 개막식인 ‘먼데이 나이트 라이브(Monday Night Live) 행사에서 피터 드산티스(Peter DeSantis) AWS 유틸리티 컴퓨팅 수석 부사장은 “앤트로픽과 협력을 통해 최신 인기 모델인 클로드 3.5 하이쿠의 지연시간 최적화 버전을 AWS 위에서 출시한다”고 밝혔다.
이번 발표는 AI 칩부터 솔루션에 이르기까지 전체 스펙트럼에 걸쳐 성능 저하 없이 비용 효율적으로 AI 모델과 서비스를 개발할 수 있도록 지원하기 위한 AWS의 하드웨어적 노력을 소개하면서 나왔다. 드산티스 부사장은 “AWS의 AI 칩 ‘트레이니움2’ 여러 개를 ‘뉴런링크’ 기술을 통해 시간 지연 없이 연결해, 총 64개의 트레이니움2 칩이 함께 작동하는 일명 ‘울트라 서버’를 구축했다”고 소개했다. 뉴런링크는 서버 간에 초당 2테라바이트의 대역폭을 제공하고 메모리에도 직접 액세스할 수 있는 초저지연 네트워크 기술이다.
그는 이어 “울트라 서버를 기반으로 클로드 3.5 하이쿠 지연시간 최적화 버전을 출시했다”며 “이 모델은 기존 표준 클로드 하이쿠 3.5보다 60% 더 빠르게 실행된다”고 전했다.
톰 브라운 앤트로픽 공동 창업자가 2일(현지시간) 미국 네바다주 라스베이거스에서 열린 AWS리인벤트 개막 무대에 올라 양사 간 기술 협력 내용을 발표하고 있다. (사진=임유경 기자) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
연이어 무대에 오른 톰 브라운 앤트로픽 공동 창립자 겸 최고 컴퓨팅 책임자는 “하이쿠는 오푸스 모델과 성능은 비슷하면서도 비용은 15분의 1밖에 들지 않는다”면서 “피터가 언급했듯이 트레이니움2에선 하이쿠를 더욱 빠르게 실행할 수 있게 됐다. API에서 스위치만 전환하면 새로운 트레이니움2 서버로 요청이 자동 전송되기 때문에 개발자들은 별도의 작업을 할 것도 없다”고 강조했다. 즉, AWS 위에선 최신 클로드 모델을 더 싸고, 빠르고, 쉽게 사용할 수 있다는 얘기다.
브라운 창립자는 앤트로픽의 차세대 클로드 모델이 AWS의 새로운 클러스터인 레이니어(Rainier) 프로젝트에서 훈련되고 있다는 점도 새롭게 밝혔다. 레이니어 프로젝트는 수십만 개의 트레이니움2 칩이 포함된 클러스터다. 그는 “레이니어 프로젝트가 AI 모델 훈련 속도를 획기적으로 높일 것”이라면서 “이는 최종 사용자인 고객 기업이 더 저렴한 비용으로 더 높은 지능을 갖춘 모델을 더 빠르게 제공받을 수 있음을 의미한다”고 강조했다.
이날 발표는 아마존의 앤트로픽 신규 투자에 따른 협력 내용을 구체적으로 공개한 것이다. AWS 리인벤트에 앞서 아마존은 앤트로픽에 40억 달러의 신규 투자를 단행한다고 발표했다. 이로써 앤트로픽에 대한 아마존의 총 투자액은 80억 달러(약 11조3000억원)로 늘었다. 이번 투자를 통해 양사는 AWS에서 앤트로픽의 AI 모델 클로드를 훈련하고, AWS 자체 AI 훈련용 칩인 트레이니움의 차세대 버전 개발에도 협력하기로 했다고 밝힌 바 있다.
AWS와 앤트로픽 간 협력 방향은 ‘클라우드 플랫폼-AI 전용 칩-AI 모델’이 3각 편대를 이루면서 함께 발전하는 최근 기술 산업 트렌드와도 정확히 일치한다. 클라우드 시장 2위인 MS는 챗GPT 개발사 오픈AI에 2019년부터 총 130억 달러(약 18조 3000억원)를 누적 투자하고 전방위적으로 협력하는 중이다. 오픈AI의 최신 모델을 애저에서 가장 빠르게 선보이고 있는 것은 물론 자체 AI 칩 마야 개발에도 협력해 AI 아키텍처를 칩 단계까지 최적화했다.
AWS의 앤트로픽에 대한 추가투자는 글로벌 클라우드 시장에서 MS 애저가 AWS를 바짝 추격하고 있는 가운데 이뤄져, MS-오픈AI 연합에 대한 견제의 고삐를 당겼다는 해석이 나온다. MS 애저는 AI 기능을 강화한 이후 글로벌 클라우드 시장에서 점유율을 크게 끌어올렸다. 시너지리서치에 따르면 올 2분기 MS 애저의 점유율은 23%로 집계됐다. 이는 2019년 2분기 16%였던 것에서 5년만에 7%포인트 상승한 것이다. 한편, 같은 기간 AWS의 점유율은 33%에서 32%로 소폭 감소해, AI 역량 강화가 요구되는 시점이었다는 분석이다.
한편, 올해 AWS 리인벤트에서는 생성형 AI 훈련과 서비스 개발에 초점을 맞춘 신기능이 대거 발표될 전망이다. 먼저 지난 5월 취임한 맷 가먼(Matt Garman) AWS 최고경영자(CEO)는 오는 3일 기조 연설을 통해 AWS 상품 전반이 AI를 중심에 두고 어떻게 혁신했는지 소개한다. AWS CEO를 거친 앤디 재시 아마존 CEO가 기조연설 특별 게스트로 참여할 예정이다. AI 모델 훈련용 칩 ‘트레이니움2’, 추론용 칩 ‘인퍼런시아2’, AI 서비스 개발 플랫폼 ‘베드록’의 신기능, 기업용 AI 챗봇 서비스 ‘아마존 큐(Q)’ 등 작년 AWS 리인벤트에서 선보인 신제품·서비스에 대한 업데이트가 예상된다. AWS가 개발 중인 새로운 자체 AI 모델 ‘올림푸스(Olympus)’를 공개할 수 있다는 전망도 나온다.
4일에는 스와미 시바수브라마니안 데이터 및 AI 담당 부사장이 기조연설에서 강력한 데이터 기반을 활용해 고객을 위한 혁신적이고 차별화된 솔루션을 개발하는 방법을 소개한다. 이어 5일에는 워너 보겔스 아마존 부사장 겸 최고기술책임자(CTO)가 복잡해지는 시스템 관련 전략 등을 주제로 기조연설을 한다.
이외에도 이번 AWS 리인벤트에서는 500개 이상의 생성형 AI 관련 세션이 진행된다. 18개 분과 2500여 개 전체 세션 중 20%에 달하는 규모다. 또 삼성전자(005930), LG전자(066570), SK텔레콤(017670), LG에너지솔루션(373220), 두산로보틱스(454910), 우아한형제들, 업스테이지, 당근마켓 등 한국 기업들도 AWS 리인벤트에 참석해 디지털 혁신 사례를 소개한다. 정보통신산업진흥원(NIPA)은 딥브레인AI, 플리토, 프렌들리AI 등 해외 진출 성공 가능성이 높은 국내 서비스형 소프트웨어(SaaS) 기업 8곳과 공동관을 마련했고, 한국인터넷진흥원(KISA)도 한국 보안 기업의 해외 진출을 돕기 위해 엔키화이트햇 등 3개 기업과 공동부스를 차렸다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.