컨텐츠 바로가기

03.22 (토)

엔비디아, 기업 에이전트 AI 추론 가속화 위해 오라클과 협력

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다


엔비디아(CEO 젠슨 황)가 미국 새너제이에서 열린 GTC에서 전 세계 기업들이 에이전트 AI 애플리케이션을 더욱 신속하게 개발할 수 있도록 오라클(Oracle)과 협력한다고 발표했다. 엔비디아(NVIDIA)는 자사의 가속 컴퓨팅과 추론 소프트웨어를 오라클의 AI 인프라와 생성형 AI 서비스와 업계 최초로 통합할 계획이다.

오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI)와 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼 간의 새로운 통합은 160개 이상의 AI 도구와 100개 이상의 엔비디아 NIM™ 마이크로서비스를 OCI 콘솔에서 직접 활용할 수 있게 한다. 또한, 양사는 오라클과 엔비디아 AI 블루프린트(AI Blueprint)의 노코드 배포를 지원하고, 엔비디아 cuVS 라이브러리를 활용해 오라클 데이터베이스 23ai(Oracle Database 23ai)에서 AI 벡터 검색(Vector Search)을 가속화하기 위해 협업하고 있다.

오라클 CEO 새프라 캐츠(Safra Catz)는 “오라클은 AI 훈련과 추론을 위한 최적의 플랫폼으로 자리 잡았으며, 이번 협력으로 고객은 더욱 혁신적인 비즈니스 성과를 창출할 수 있게 됐다. 엔비디아의 기술과 OCI의 뛰어난 유연성, 확장성, 성능, 보안성의 결합은 AI 도입을 가속화하고, 데이터 활용 가치를 극대화할 것”이라고 말했다.

엔비디아의 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “엔비디아와 오라클은 추론의 시대를 함께하는 최고의 파트너다. AI와 가속 컴퓨팅을 선도하는 엔비디아와 전 세계의 많은 기업 데이터를 처리하고 있는 오라클이 만나, 에이전트 AI 혁신을 통해 기업이 고객과 파트너를 위한 놀라운 서비스를 제공할 수 있도록 지원하고 있다”고 말했다.

기업 AI 요구에 맞춘 특화 솔루션

엔비디아 AI 엔터프라이즈는 추론 모델 배포 시간을 단축하기 위해 OCI 콘솔에서 직접 제공되며, 이를 통해 고객은 최신 엔비디아 라마 네모트론(Llama Nemotron) 모델을 포함한 100개 이상의 최적화된 클라우드 네이티브 추론 마이크로서비스인 엔비디아 NIM™을 빠르고 손쉽게 활용할 수 있다.

OCI 베어메탈 인스턴스와 OCI 쿠버네티스 엔진(Kubernetes Engine)을 사용하는 쿠버네티스 클러스터에서 엔비디아 AI 엔터프라이즈를 배포 이미지로 사용할 수 있으며, OCI 콘솔 고객은 오라클을 통해 직접 결제하고 고객 지원을 받을 수 있다.

기업들은 OCI의 150개 이상의 AI와 클라우드 서비스를 엔비디아 가속 컴퓨팅과 엔비디아 AI 엔터프라이즈와 결합해 데이터센터, 퍼블릭 클라우드, 엣지 환경에서 AI를 배포할 수 있다. 이 솔루션은 데이터 프라이버시, 소버린 AI(Sovereign AI), 저지연성 요건을 충족하는 통합 AI 스택을 제공한다.

생명공학 회사인 솔레이 테라퓨틱스(Soley Therapeutics)는 OCI AI 인프라, 엔비디아 AI 엔터프라이즈, 엔비디아 블랙웰(Blackwell) GPU를 배포해 세포 언어를 캡처, 디코딩, 해석해 세포 운명을 예측함으로써 복잡한 질병에 대한 가능한 치료법을 찾기 위한 AI 신약 발견 플랫폼을 구축하고 있다.

솔레이 테라퓨틱스의 공동 창립자이자 CEO인 예렘 예기아자리안스(Yerem Yeghiazarians)는 “우리는 AI가 암과 기타 복잡한 질병에 대한 치료법 개발에 도움을 줄 수 있는 잠재력을 믿는다. OCI와 엔비디아의 조합은 우리에게 필요한 저장소, 컴퓨팅, 소프트웨어 도구, 지원을 제공하는 풀 스택 AI 솔루션을 제공하고, 우리는 페타바이트의 데이터를 활용해 AI 신약 발견 플랫폼을 더 빠르게 혁신할 수 있다”고 말했다.

맞춤형 블루프린트로 대규모 AI 배포

OCI AI 블루프린트는 고객이 소프트웨어 스택을 결정하거나 인프라를 수동으로 프로비저닝할 필요 없이 AI 워크로드를 신속하게 실행할 수 있도록 지원하는 노코드 배포 레시피를 제공한다. 또한, 이 블루프린트는 엔비디아 GPU, NIM 마이크로서비스, 사전 구성된 가시성 도구에 대한 명확한 하드웨어 권장 사항을 제공해 기업이 AI 프로젝트를 몇 주에서 몇 분으로 단축할 수 있도록 돕는다.

더불어, 엔비디아 블루프린트는 엔비디아 스택 전반에 걸친 통합된 개발자 경험을 제공하며, 엔터프라이즈 AI 활용 사례를 위한 참조 워크플로우를 지원한다. 엔비디아 블루프린트를 통해 기업은 엔비디아 AI 엔터프라이즈와 엔비디아 옴니버스™(Omniverse™) 소프트웨어, API, 마이크로서비스를 사용해 맞춤형 AI 애플리케이션을 구축하고 운영할 수 있다. 예를 들어, 개발자는 고객 서비스 AI 어시스턴트용 엔비디아 AI 블루프린트로 시작한 후, 필요에 따라 맞춤화할 수 있다.

물리적 AI와 시뮬레이션 애플리케이션의 개발, 배포, 확장을 간소화하기 위해, 엔비디아 옴니버스 플랫폼이 올해 말 OCI 마켓플레이스(Oracle Cloud Infrastructure Marketplace)에서 제공될 예정이며, 엔비디아 L40S GPU로 가속된 컴퓨팅 베어메탈 인스턴스가 사전 구성된다.

OCI 데이터 사이언스에서 엔비디아 NIM으로 실시간 AI 추론 구현

기업의 AI 도입을 더욱 가속화하고 최소한의 설정으로 신속한 AI 배포를 지원하기 위해, 데이터 과학자는 OCI 데이터 사이언스(OCI Data Science)에서 사전 최적화된 엔비디아 NIM 마이크로서비스를 직접 활용할 수 있다. 이를 통해 기업은 복잡한 인프라 관리 없이 실시간 AI 추론을 구현할 수 있다.

데이터 보안과 규정 준수를 위해, 모델은 고객의 OCI 테넌시(Tenancy) 내에서 실행된다. 고객은 유연한 종량제 기반의 시간 요금제를 통해 모델을 구매하거나, 오라클 유니버설 크레딧(Oracle Universal Credit)를 적용할 수 있다.

기업들은 이 통합 솔루션을 활용해 사전 구성된 최적화된 NIM 추론 엔진을 몇 분 안에 배포하고, AI 기반 어시스턴트, 실시간 추천 엔진, 코파일럿과 같은 다양한 활용 사례에서 가치를 신속하게 창출할 수 있다. 이러한 통합은 소규모 워크로드에서 시작해 원활하게 엔터프라이즈 전반으로 확장할 수 있다.

엔비디아 가속 컴퓨팅 플랫폼으로 오라클 데이터베이스 23ai에서 AI 벡터 검색 속도 향상

오라클과 엔비디아는 오라클 데이터베이스 23ai에서 AI 벡터 검색 워크로드의 벡터 임베딩과 벡터 인덱스 생성 속도를 가속화하기 위해, 엔비디아 GPU와 엔비디아 cuVS를 활용하기 위해 협력하고 있다.

기업들은 텍스트, 이미지, 비디오 등 대량의 입력 데이터를 일괄 벡터화해 벡터 임베딩을 활성화할 수 있으며, 벡터 인덱스를 빠르게 생성하고 유지할 수 있다. 오라클 데이터베이스 고객들은 엔비디아 GPU로 가속화된 AI 벡터 검색을 활용해 AI 파이프라인 성능을 대폭 향상시켜 대규모 AI 벡터 워크로드를 지원할 수 있다.

듀이비전(DeweyVision)은 고급 컴퓨터 비전과 AI 기술을 활용해 미디어를 데이터로 변환하고, 이를 검색 가능하고 활용할 수 있도록 지원한다. 듀이비전은 노코드 데이터 웨어하우징 AI 도구를 위해 오라클 자율운영 데이터베이스(Oracle Autonomous Database)에서 오라클 데이터베이스 23ai를 활용하고 있다. 이를 통해, 프로덕션 전문가들은 영상 자료를 몇 분 만에 정리하고 직관적인 검색 기능을 활용해 워크플로우를 연결하며 빠르게 영상 편집을 수행할 수 있다.

듀이비전의 CEO 마지드 베마니안(Majid Bemanian)은 "오라클 데이터베이스 23ai와 AI 벡터 검색을 활용하면 듀이비전 플랫폼의 확장성을 높이는 동시에 검색 성능을 크게 향상할 수 있다. 엔비디아 GPU를 활용해 오라클 데이터베이스에 로드할 벡터 임베딩을 생성함으로써, 새로운 데이터의 플랫폼 내 유입 속도를 가속화할 수 있다. 또한, 오라클 자율운영 데이터베이스와 오라클 데이터베이스 23ai의 통합 기능을 통해 운영 비용을 절감하면서 지속적인 성장과 새로운 기회를 모색할 수 있을 것으로 기대한다. 듀이비전, 오라클 데이터베이스 23ai, 그리고 OCI에서 구동되는 엔비디아 GPU의 조합이 우리가 ‘할리우드의 데이터 웨어하우스’로 자리 잡는 데 중요한 역할을 할 것이라 확신한다"고 덧붙였다.

OCI에서의 엔비디아 블랙웰로 AI를 어디서나 구현

오라클과 엔비디아는 다양한 클라우드 환경에서 AI 인프라를 지속적으로 발전시키고 있다. 여기에는 OCI의 공공 지역, 정부 클라우드, 소버린 클라우드, OCI 전용 리전(Dedicated Region), 오라클 알로이(Alloy), 오라클 컴퓨트 클라우드앳커스터머(Compute Cloud@Customer), OCI 이동식 엣지 디바이스(Roving Edge Devices) 등이 포함된다.

여기에는 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 클러스터 네트워크 환경, 엔비디아 스펙트럼™ 이더넷(Spectrum™ Ethernet) 스위치 그리고 시장 최대 규모의 AI 슈퍼클러스터를 위해 최적화된 엔비디아 NV링크™(NVLink™)와 NV링크 스위치(NVLink™ Switch) 기능이 포함된다.

OCI는 엔비디아 GB200 NVL72 시스템을 OCI 슈퍼클러스터(Supercluster)에서 제공할 예정이며, 최대 131,072개의 엔비디아 GPU를 지원하는 이 시스템은 곧 일반에 제공될 예정이다. 아울러 엔비디아 블랙웰 울트라(Blackwell Ultra) GPU를 탑재한 클라우드 기반 최대 규모의 AI 슈퍼컴퓨터에 대한 주문을 접수 중이다.

OCI는 엔비디아 블랙웰 가속 컴퓨팅 플랫폼의 차세대 버전을 제공하는 최초의 클라우드 서비스 제공업체 중 하나가 될 것이다. 지난해 소개된 혁신적인 블랙웰 아키텍처를 기반으로 한 블랙웰 울트라는 엔비디아 GB300 NVL72 랙 스케일 솔루션과 엔비디아 HGX™ B300 NVL16 시스템을 포함한다. GB300 NVL72는 엔비디아 GB200 NVL72에 비해 1.5배 더 많은 AI 성능을 제공하며, 엔비디아 호퍼™(Hopper™)로 구축된 AI 공장에 비해 블랙웰의 수익 기회를 50배 증가시킨다.

글로벌 대화형 인공지능 선도기업 사운드하운드(SoundHound)는 음성과 대화형 AI 솔루션을 제공해 전 세계 브랜드의 수백만 제품에서 음성 관련 경험을 지원한다. 그들의 음성 AI 플랫폼은 OCI에서 실행되며 매년 수십억 개의 쿼리를 처리하고, 엔비디아 GPU를 사용해 고객에게 빠르고 정확한 음성 서비스를 제공한다.

사운드하운드의 제품 최고 책임자인 제임스 홈(James Hom)은 "사운드하운드는 OCI와 오랜 협력 관계를 유지해 왔으며, 우리의 지속적인 협력이 미래 성장 지원에 중요한 역할을 할 것이라고 믿는다. 엔비디아 GPU는 차세대 음성 AI 모델의 훈련 속도를 획기적으로 향상시킬 것"이라고 말했다.

오라클 분산형 클라우드 소개

오라클의 분산형 클라우드는 클라우드의 이점을 유지하면서도 더 높은 수준의 제어와 유연성을 제공한다. 오라클의 분산 클라우드 라인업은 다음과 같다.

- 공공 클라우드: 하이퍼스케일 공공 클라우드 지역은 엄격한 EU 주권 통제를 필요로 하는 조직을 포함해 모든 규모의 기업을 지원한다. 여기에서 전체 지역 목록을 확인할 수 있다.

- 전용 클라우드: 고객은 OCI 전용 지역을 통해 모든 OCI 클라우드 서비스를 자체 데이터센터에서 운영할 수 있으며, 파트너사는 오라클 알로이를 활용해 OCI 클라우드 서비스를 재판매하고 맞춤형 환경을 구축할 수 있다. 또한, 오라클은 미국, 영국, 호주 정부 클라우드뿐만 아니라 국가 안보를 위한 독립 클라우드 지역도 운영하고 있으며, 각 솔루션은 고객이 소버린 클라우드로 배포할 수 있는 완전한 클라우드와 AI 스택을 제공한다.

- 하이브리드 클라우드: OCI는 오라클 엑사데이터 클라우드앳커스터머(Exadata Cloud@Customer)와 컴퓨트 클라우드앳커스터머를 통해 주요 클라우드 서비스를 온프레미스에서 제공하며, 현재 60개국 이상에서 배포를 관리하고 있다. 또한, OCI 로빙 엣지 인프라스트럭처(Roving Edge Infrastructure)는 견고하고 휴대 가능한 고성능 장비로 구성돼 고객이 엣지에서 원격 AI 추론을 활용할 수 있도록 지원한다.

- 멀티클라우드: OCI는 아마존 웹 서비스(Amazon Web Services, AWS), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure) 등의 모든 하이퍼스케일 클라우드 제공업체 내에서 물리적으로 배포돼 있으며, 오라클 데이터베이스앳AWS(Database@AWS), 오라클 데이터베이스앳애저(Database@Azure), 오라클 데이터베이스앳구글클라우드(Database@Google Cloud), 오라클 AWS 기반 오라클 히트웨이브(HeatWave on AWS) 등 저지연, 네이티브 통합 오라클 데이터베이스 서비스를 제공한다. 또한, 마이크로소프트 애저용 오라클 인터커넥트(Interconnect for Microsoft Azure)와 구글 클라우드용 오라클 인터커넥트(Interconnect for Google Cloud)를 통해 고객이 여러 클라우드의 주요 기능을 조합해 활용할 수 있도록 지원한다.

<이미지를 클릭하시면 크게 보실 수 있습니다>



<<저작권자 ⓒ 게임포커스, 무단전재 및 재배포 금지>


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.