[AI리포터]
[디지털투데이 AI리포터] 중국 인공지능(AI) 기업 Z.ai(옛 지푸 AI)가 오픈소스 기반 산업용 이미지 생성 AI 모델 'GLM-Image(GLM-이미지)'를 발표했다.
15일(현지시간) 온라인 매체 기가진에 따르면, GLM-이미지는 자기회귀(Auto-regressive) 모델과 확산(Diffusion) 모델을 결합한 하이브리드 구조로, 고품질 이미지 생성이 가능하다.
자기회귀 모델은 90억 파라미터를 갖춘 'GLM-4-9B-041'로 초기화됐고, 확산 모델은 70억 파라미터의 'CogView4'를 기반으로 구축됐다. 이 하이브리드 구조는 텍스트 렌더링과 지식 집약적 생성에서 큰 이점을 제공하며, 프로세싱 속도 역시 높아졌다.
GLM-이미지는 AI 이미지 생성의 한계를 뛰어넘는 기술적 진보를 보여준다. [사진: Z.ai] |
[디지털투데이 AI리포터] 중국 인공지능(AI) 기업 Z.ai(옛 지푸 AI)가 오픈소스 기반 산업용 이미지 생성 AI 모델 'GLM-Image(GLM-이미지)'를 발표했다.
15일(현지시간) 온라인 매체 기가진에 따르면, GLM-이미지는 자기회귀(Auto-regressive) 모델과 확산(Diffusion) 모델을 결합한 하이브리드 구조로, 고품질 이미지 생성이 가능하다.
자기회귀 모델은 90억 파라미터를 갖춘 'GLM-4-9B-041'로 초기화됐고, 확산 모델은 70억 파라미터의 'CogView4'를 기반으로 구축됐다. 이 하이브리드 구조는 텍스트 렌더링과 지식 집약적 생성에서 큰 이점을 제공하며, 프로세싱 속도 역시 높아졌다.
확산 모델은 강력한 일반화 능력을 갖췄지만, 복잡한 지식 표현에는 한계가 있다. 반면, 자기회귀 모델은 텍스트 충실도를 높이지만 실행 속도가 느리다는 단점이 있다. GLM-이미지는 두 모델의 장점을 결합해 정교한 이미지 생성이 가능하도록 설계됐다.
Z.ai는 GLM-이미지를 오픈소스로 공개했으며, 깃허브(GitHub)와 허깅페이스(Hugging Face)에서 코드와 모델 데이터를 다운로드할 수 있다. 이번 발표는 AI 기반 이미지 생성 기술의 새로운 가능성을 열 것으로 기대된다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
