컨텐츠 바로가기

11.26 (화)

이슈 인공지능 시대가 열린다

텍스트→3D 그래픽 변환 10초 만에 끝…1년 전엔 1시간이었는데

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
한겨레

엔비디아 제공

<이미지를 클릭하시면 크게 보실 수 있습니다>


인공지능(AI)칩 개발 기업 엔비디아가 텍스트를 3D 그래픽으로 변환하는 생성형 인공지능 모델 ‘라떼3D’(LATTE3D)를 공개했다.



엔비디아는 25일 “라떼3D는 가상 3D 프린터처럼 텍스트 프롬프트를 1초 안에 사물과 동물의 3D 그래픽으로 변환할 수 있다”고 밝혔다. 엔비디아는 라떼3가 표준 렌더링(3D 모델을 2D로 변환하는 프로세스) 애플리케이션에 주로 사용되는 포맷(틀)으로 제작됐으며, 비디오 게임·광고 캠페인·디자인 프로젝트 또는 로보틱스용 가상 훈련장 개발 등을 위한 가상 환경을 쉽게 구현할 수 있다고 설명했다.



라떼3D를 개발한 산자 피들러(Sanja Fidler) 엔비디아 인공지능 리서치(research) 담당 부사장은 “1년 전만 해도 인공지능 모델이 이 정도 품질의 3D 비주얼을 생성하는 데 1시간이 걸렸지만, 이제는 10~12초 정도면 충분하다”며 “훨씬 더 빠른 속도로 결과를 생성할 수 있게 되면서 업계 전반의 크리에이터들이 거의 실시간으로 텍스트를 3D로 생성할 수 있게 됐다”고 말했다.



이날 엔비디아는 “크리에이터는 처음부터 디자인을 시작하거나 3D 에셋 라이브러리(데이터·미디어 저장소)를 일일이 찾아보는 대신 라떼3D를 사용해 머릿속에 아이디어가 떠오르는 즉시 세부적인 개체를 생성할 수 있다”고 강조했다. 라떼3D가 각 텍스트 프롬프트에 따라 몇 가지 다른 3D 모양 옵션을 생성해 크리에이터에게 선택권을 제공하면, 선택된 개체는 몇 분 내에 더 높은 품질로 최적화된다. 이후 사용자는 해당 그래픽을 그래픽 소프트웨어 애플리케이션이나 엔비디아의 옴니버스(Omniverse)와 같은 플랫폼으로 전송할 수 있다. 엔비디아는 “이를 통해 오픈유에스디(Universal Scene Description·OpenUSD) 기반 3D 워크플로우와 애플리케이션을 사용할 수 있다”고 밝혔다. 픽사 애니메이션 스튜디오에서 개발한 오픈유에스디는 도구, 데이터, 워크플로우 전반에 걸쳐 상호 운용성을 제공하는 고성능 3D 장면 묘사 기술이다.



한편, 엔비디아는 라떼3D 훈련에 자사의 A100 텐서 코어 그래픽처리장치(GPU)가 사용됐다고 밝혔다. 또한 엔비디아는 라떼3D가 3D 그래픽 외에도 오픈에이아이의 챗지피티를 통해 생성된 다양한 텍스트 프롬프트를 훈련했다고 밝혔다. 엔비디아는 “이를 통해 사용자가 특정 3D 개체를 설명할 때 제시할 수 있는 다양한 문구를 처리하는 능력을 향상했다”고 설명했다.



한겨레

엔비디아 제공

<이미지를 클릭하시면 크게 보실 수 있습니다>


박지영 기자 jyp@hani.co.kr



▶▶한겨레의 벗이 되어주세요 [후원하기]
▶▶한겨레 뉴스레터 모아보기▶▶[기획] 누구나 한번은 1인가구가 된다


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.