컨텐츠로 건너뛰기
검색
AI타임스 언론사 이미지

아마존, '이미지 생성 AI' 공개...멀티모달 기능도 따라잡아

AI타임스 박찬
원문보기

아마존, '이미지 생성 AI' 공개...멀티모달 기능도 따라잡아

서울맑음 / 3.0 °
[박찬 기자]

아마존웹서비스(AWS)가 기업용 인공지능(AI) 챗봇에 이어 이미지 생성기를 선보이며 빅테크의 AI 서비스를 따라잡고 있다. 그동안 마이크로소프트(MS)나 구글에 비해 생성 AI 분야에서 뒤처진다는 평가를 만회하는 모양새다.

테크크런치는 29일(현지시간) AWS가 연례 테크 컨퍼런스 '리인벤트 2023'에서 텍스트로 이미지를 생성하는 AI 모델 '타이탄 이미지 생성기(Titan Image Generator)'를 공개했다고 보도했다.

이에 따르면 AWS는 타이탄 이미지 생성기를 '아마존 베드록'에 프리뷰로 출시했다. 타이탄 이미지 생성기는 오픈AI '달리(DALL-E)'와 같은 독립적인 앱이나 웹서비스가 아니라, 베드록에서 API를 활용해 기업이 자체 이미지 생성 AI 서비스를 만들 수 있도록 지원하는 개발자 도구다. 광범위한 분야에 걸쳐 다양한 데이터셋을 학습했고, 자체 데이터로 미세조정도 할 수 있다.

베드록은 기업들이 아마존의 대형언어모델(LLM) '타이탄' 뿐만 아니라 다양한 파운데이션 모델에 접근할 수 있도록 지원하는 완전 관리형 서비스다.

타이탄 이미지 생성기는 텍스트 프롬프트로 이미지를 생성하는 것 뿐 아니라 기존 이미지를 자동으로 편집하는 기능도 제공한다. 이미지 마스크를 사용한 인페인팅과 이미지 배경을 확장하거나 변경하기 위한 아웃페인팅 기능을 지원하고, 이미지 크기를 변경하거나 모델이 생성할 이미지 변형 수를 지정할 수도 있다.

타이탄 이미지 생성기에서 만들어지는 모든 이미지들은 자동으로 눈에는 보이지 않는, 이른바 '인비저블 워터마크(invisible watermarks)'도 포함한다.


스와미 시바수브라마니안 AWS 데이터 및 AI 부문 부사장은 "인비저블 워터마크는 책임 있는 AI를 지원하기 위한 것"이라며 "잘못된 정보가 확산하는 것을 막을 수 있을 것"이라고 말했다.

AWS는 타이탄 이미지 생성기와 관련해 AI 면책 정책을 통해 사용자들이 저작권 침해 소송을 당하지 않도록 보호하겠다는 방침도 강조했다.

이와 함께 '타이탄 멀티모달 임베딩(Titan Multimodal Embeddings)' 모델을 사용하면 기업은 사용자를 위해 보다 상황에 맞는 검색 및 추천 엔진을 구축할 수 있다. 타이탄 멀티모달 임베딩 모델을 사용하면 텍스트, 이미지 또는 둘의 조합을 입력으로 제공할 수 있다.


이 모델은 이미지를 최대 128개의 토큰 길이의 짧은 영어 텍스트 문자열로 변환하고 이를 벡터 데이터베이스 임베딩 또는 숫자 표현으로 변환할 수 있다. 이를 통해 AI는 검색 목적으로 이미지의 의미론적 의미(semantic meaning)를 캡처할 수 있다. 사용자는 목적에 맞도록 자체 이미지-캡션 쌍 데이터로 모델을 미세조정할 수도 있다.

시바수브라마니안 부사장은 "이제 신속하게 생성 스토어를 생성하고 임베딩을 검색해 더 정확하고 상황에 맞게 관련성이 높은 멀티 모달 검색을 구축할 수 있다"라고 말했다.

예를 들어 사용자가 드레스 이미지를 업로드하고 AI 비서에게 어떤 상의가 어울리는지 묻는 형식으로 제품 검색을 제공할 수 있다. 다양한 유형의 신발, 모자, 재킷을 스타일별로 검색하거나 뚜렷한 시각적 속성이 있는 제품을 검색하는 데 도움을 줄 수 있다. 또 텍스트와 이미지를 결합해 회사별 제조 부품을 설명함으로써 검색 시 부품을 더 효과적으로 식별할 수 있다.



더불어 AWS는 이날 행사에서 LLM을 쉽게 훈련하고 미세 조정할 수 있는 '아마존 세이지메이커 하이퍼포드(Amazon SageMaker HyperPod)'를 출시했다.

세이지메이커 하이퍼포드는 온디맨드 AI 훈련 클러스터에 대한 액세스를 제공한다. 개발자는 포인트 앤 클릭 명령과 상대적으로 간단한 스크립트의 조합을 통해 클러스터를 프로비저닝할 수 있으며, 이는 인프라를 수동으로 구성하는 것보다 훨씬 빠르다.

기업은 엔비디아 'H100' GPU나 AWS가 자체 개발한 '트래니움(Trainium) 프로세서 시리즈의 칩을 선택할 수 있다. AWS에 따르면 세이지메이커 하이퍼포드는 LLM을 훈련하는 데 필요한 시간을 최대 40%까지 줄여준다.

세이지메이커 하이퍼포드는 AI 훈련 클러스터 설정 프로세스뿐만 아니라 유지 관리도 자동화한다. 고객 클러스터의 인스턴스 중 하나가 오프라인 상태가 되면 내장된 자동화 소프트웨어가 자동으로 복구 시도를 한다. 복구가 실패하면 세이지메이커 하이퍼포드는 오작동하는 노드를 새 노드로 교체한다.

LLM 훈련에는 몇주 또는 몇달이 걸린다. 이때 가동 중단으로 인해 기본 AI 인프라가 오프라인 상태가 되면, 개발자는 훈련을 처음부터 다시 시작해야 하며 이로 인해 프로젝트가 크게 지연될 수 있다. 이런 상황을 방지하기 위해 세이지메이커 하이퍼포드는 훈련 세션 중에 AI 모델을 주기적으로 저장하고 가장 최근 스냅샷에서 세션을 재개한다.

안쿠르 메흐로트라 AWS 세이지메이커 총괄 관리자는 "세이지메이커 하이퍼포드는 분산 훈련에 최적화된 가속화된 인스턴스로 분산 클러스터를 생성할 수 있는 기능을 제공한다"라며 "클러스터 전체에 모델과 데이터를 효율적으로 배포할 수 있는 도구를 제공하므로 훈련 프로세스 속도가 빨라진다"라고 설명했다.

세이지메이커 하이퍼포드는 이날부터 AWS의 오하이오, 북부 버지니아, 오레곤, 싱가포르, 시드니, 도쿄, 프랑크푸르트, 아일랜드 및 스톡홀름 클라우드 지역에서 정식 출시됐다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>