컨텐츠 바로가기

엔비디아, AI 디자인 도구 기능 강화...스케치부터 편집까지 만능키 역할 톡톡

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
AI타임스

엔비디아가 디자인 스케치부터 편집까지 할 수 있는 다양한 AI 툴을 계속 선보이고 있다. (출처=셔터스톡, 편집=김동원 기자)

<이미지를 클릭하시면 크게 보실 수 있습니다>


엔비디아가 디자인 스케치부터 편집까지 할 수 있는 다양한 AI 툴을 계속 선보이고 있다. (출처=셔터스톡, 편집=김동원 기자)365일 지치지 않고 불평불만하지 않는 디자인 조수가 등장했다. 인공지능(AI)이다.

엔비디아 AI 연구원들로 구성된 엔비디아 리서치팀은 적대적 생성 신경망(Generative Adversarial Networks, GAN)을 기반으로 한 AI 디자인 툴을 계속 선보이고 있다. GAN은 두 개의 네트워크로 구성된 심층 뉴럴 네트워크 구조로 한 네트워크가 다른 네트워크와 서로 대립해 경쟁하는 방식으로 학습을 진행하는 기술이다.

엔비디아가 선보인 디자인 툴에는 문구를 입력하면 AI가 실시간으로 해당 장면을 그려주는 스케치 역할부터 사진에서 불필요한 장면을 제거하거나 애완동물 표정과 포즈를 다른 동물에 접목하는 등 다양한 기능이 탑재됐다.

AI가 디자인 도구로 사용된 것은 이번이 처음이 아니다. 네이버는 AI가 사용자 지시대로 웹툰 그림을 채색하는 '웹툰 AI 페인터(Webtoon AI Painter)'를 지난 달 출시했고, 어도비는 AI와 머신러닝(ML)으로 사진을 쉽게 편집하고 이미지를 창작하는 기술을 계속 선보이고 있다.

AI 관련 아바타를 제공하는 회사에서 개발 업무를 담당하는 AI 관계자는 "AI는 소설 창작, 작곡, 작사 등 다양한 예술 분야에 창작자를 지원하는 도구로 활용할 수 있도록 많은 개발이 이뤄지고 있다"며 "AI가 부수적인 업무를 담당하면서 창작자는 아이디어 창출 등 사람만이 할 수 있는 중요 작업에 더 많은 시간을 할애할 수 있을 것"이라고 말했다.

엔비디아 측은 홈페이지를 통해 "엔비디아 연구원들은 딥러닝 아키텍처와 알고리즘을 실용적인 애플리케이션에 적용할 수 있도록 매일 도전하고 있다"면서 "사용자가 딥러닝에 재미와 흥미를 느낄 수 있는 여러 도구를 계속 선보일 것"이라고 밝혔다.

간단한 단어로 사실적인 풍경 생성하는 AI 페인팅 툴 '고갱2'

AI타임스

엔비디아는 문구를 입력하면 AI가 실시간으로 장면을 생성하는 '고갱2'를 최근 선보였다. (출처=엔비디아)


엔비디아는 문구를 입력하면 AI가 실시간으로 장면을 생성하는 '고갱2'를 최근 선보였다. (출처=엔비디아)엔비디아가 최근 선보인 디자인 AI 툴 중 하나는 '고갱2(GauGAN2)'다. 2019년 출시한 고갱의 최신 버전이다.

프랑스 후기인상파 화가 폴 고갱(Paul Gauguin)의 이름을 딴 이 AI 툴은 사용자의 상상력을 그림으로 만들어주는 딥러닝 모델을 갖췄다. '해변의 일몰'과 같은 문구를 입력하기만 하면 AI가 실시간으로 장면을 생성한다.

'바위가 많은 일몰의 해변'과 같이 내용을 추가하거나 일몰을 오후 또는 비오는 날로 바꾸면 AI 툴이 GAN을 기반으로 즉시 그림을 수정한다.

엔비디아는 고갱2에 대해 세그멘테이션 맵, 인페인팅과 텍스트-이미지 생성을 단일 모델에 결합해 단어와 그림의 혼합을 사실적 예술로 바꾸는 도구라고 설명했다. 또 고갱2의 AI 모델은 엔비디아 DGX 슈퍼POD(DGX SuperPOD) 기반 엔비디아 셀린(Selene) 슈퍼컴퓨터를 사용해 훈련했다고 밝혔다.

모델 개발에는 1000만 개의 고품질 풍경 이미지와 겨울, 안개, 무지개와 같이 단어와 단어가 해당하는 영상 간의 연결을 학습시키는 신경망을 사용했다고 부연했다.

엔비디아 측은 "텍스트-이미지 또는 세그멘테이션 맵-이미지 애플리케이션을 위한 최신 모델에 비해 고갱2의 신경망은 훨씬 다양한 고품질 이미지를 생성할 수 있다"며 "아티스트들은 고갱2를 사용해 현실기반 이미지뿐만 아니라 다른 세상의 풍경도 묘사할 수 있다"고 밝혔다.

오래된 사진 결함 메꾸는 '이미지 인페인팅'

AI타임스

엔비디아는 오래된 사진 표면 결함을 제거하는데 유용한 AI 편집 툴 '이미지 인페이팅'을 선보인 바 있다.(출처=엔비디아)

<이미지를 클릭하시면 크게 보실 수 있습니다>


엔비디아는 오래된 사진 표면 결함을 제거하는데 유용한 AI 편집 툴 '이미지 인페이팅'을 선보인 바 있다.(출처=엔비디아)엔비디아는 딥러닝 기반 이미지 편집 툴인 '엔비디아 이미지 인페이팅'을 개발, 지난 2018년 선보인 바 있다. 이 편집 툴은 이미지 중에서 지워진 부분을 AI가 주변에 맞게 스스로 채우는 기술이다.

이 AI 툴은 오래된 사진 표면 결함을 제거하는 용도로 사용할 수 있다. 딥러닝과 이미지 복원 기술로 오래된 사진의 지워진 부분을 채우고, 불필요한 부분과 얼룩을 제거하는 방식이다.

엔비디아는 이 기술을 완성하기 위해 임의의 모양과 크기, 무작위 줄무늬 등으로 구성된 5만 5116개의 마스크를 생성한 후 AI 모델을 훈련했다고 밝혔다. 또 2만 5000회의 테스트를 거쳐 정확도를 개선시켜 왔다고 설명했다.

화상회의 참석 부담 줄이는 '비드투비드 카메오'

AI타임스

엔비디아는 언제 어디서나 부담없이 화상회의에 참여할 수 있는 '비드투비드 카메오'를 선보였다. (출처=엔비디아)


엔비디아는 언제 어디서나 부담없이 화상회의에 참여할 수 있는 '비드투비드 카메오'를 선보였다. (출처=엔비디아)엔비디아가 개발한 AI 툴에는 최근 팬데믹으로 급증한 화상회의에 사용할 수 있는 모델도 있다. '비드투비드(VID2VID) 카메오'다.

이 도구는 생성적 GAN을 사용해 사용자의 2D 이미지만으로 참여자가 실제 말하는 것과 같은 합성 영상을 생성한다. 사용자는 해당 기능을 통해 언제 어디서나 완벽한 모습으로 화상회의에 참여할 수 있다.

방법은 간단하다. 사용자는 자신이 화상회의에 참여했을 때 원하는 모습과 아바타를 제출하면 된다. 이후 꾸미지 않은 모습으로 화상회의에 참여해도 AI가 사용자의 움직임을 실시간 포착해 제출한 이미지 모습과 동일하게 사용자 모습을 수정해 회의 영상에 송출한다.

예를 들어 깔끔한 정장을 입은 사진을 업로드 하게 되면, 사용자는 잠옷 차림으로 회의를 참여해도 회의에 참가한 사람들은 사용자가 정장을 입은 것처럼 보이게 된다.

엔비디아 측은 "비드투비드 카메오는 AI를 활용해 회의 참석자의 용모를 단정하게 보이게 하는 실용적인 기술"이라며 "이 외에도 기존 화상회의에 필요한 대역폭을 최대 10배 줄여 랙(lag) 현상을 방지하는 기술도 탑재됐다"고 설명했다.

동물 표정과 이미지를 다른 동물에 투영하는 '가니몰'

AI타임스

엔비디아는 동물의 사진과 포즈를 다른 동물에 접목할 수 있는 '가니몰'도 선보인 바 있다. (출처=엔비디아)

<이미지를 클릭하시면 크게 보실 수 있습니다>


엔비디아는 동물의 사진과 포즈를 다른 동물에 접목할 수 있는 '가니몰'도 선보인 바 있다. (출처=엔비디아)엔비디아는 동물의 사진과 포즈를 다른 동물에 접목할 수 있는 '가니몰(GANImal)' 도구도 선보인 바 있다.

이 도구는 동물의 사진과 포즈를 AI가 분석해 다른 동물 사진에 접목하는 형태로 사용할 수 있다. 반려동물로 키우는 강아지나 고양이의 사진을 업로드하면, 사진 속 동물의 표정과 포즈를 스라소니, 표범, 곰 등 수십 종의 동물에 적용할 수 있다.

해당 기능은 영상 제작 등에 활용할 수 있다. 호랑이 등 맹수가 재주를 부리는 영상이 영화 제작에 필요할 경우, 묘기를 부리는 강아지의 모습을 촬영해 그 움직임을 호랑이에 접목하는 등에 사용하는 방식이다. 제작자 입장에서는 맹수를 위험하게 촬영하거나 고가의 편집 비용을 투자할 필요없이 간단하게 영상을 제작할 수 있다.

이 도구에는 GAN 기반 '푸닛(FUNIT, Few-shot, UNsupervised Image-to-image Translation)' 알고리즘이 사용됐다. 테스트 진행 시 몇 개의 예제 이미지만으로 전에는 볼 수 없었던 이미지 모습을 원하는 대상에 적용하는 기술이다.

엔비디아 측은 "가니몰 앱에 원하는 이미지를 입력하면 이미지 번역 네트워크가 다른 동물에 고유 특성을 투영할 수 있다"며 "사용자는 해당 기능으로 반려동물의 자아를 다른 동물에 접목할 수 있게 된다"고 설명했다.

AI타임스 김동원 기자 goodtuna@aitimes.com

[관련기사]메타버스 넘어서는 '아크버스' 만드는 네이버...AI·클라우드·로봇·디지털트윈 기술 집합

[관련기사]"AI·3D 모르는 작가도 VR웹툰 그린다"…공감미디어, 'VR웹툰 제작 툴' 출시

Copyright ⓒ '인공지능 전문미디어' AI타임스 (http://aitimes.com)
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.