컨텐츠 바로가기

이슈 인공지능 시대가 열린다

AI 그림은 손가락 6개에 글자도 깨진다? 챗GPT가 해결했다

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
글 완벽하게 이해하고 표현하는
GPT-4o 이미지 생성 모델 공개
그래픽 디자이너 일자리 위협

오픈AI의 GPT-4o 이미지 생성 모델이 생성한 '가장 인기 있는 칵테일 4종' 이미지. 글자를 깨짐 없이 표현하고, 그림과 해당 그림을 설명하는 글을 정확하게 연결시켰다. 오픈AI 제공

<이미지를 클릭하시면 크게 보실 수 있습니다>


생성형 인공지능(AI) 챗GPT의 이미지 생성 기능이 크게 강화돼, 인포그래픽이나 웹툰처럼 복잡한 이미지도 생성할 수 있게 됐다. 오픈AI는 챗GPT에 '글'을 인식하고 표현하는 새로운 이미지 생성 AI 모델을 추가한다고 25일(현지시간) 밝혔다. 누구나 챗GPT에 말로 주문하기만 하면 글자가 포함된 정교한 이미지를 빠르게 만들어 낼 수 있게 된 것이다. 이 기능은 챗GPT 무료 버전에도 포함된다.
한국일보

오픈AI의 GPT-4o 이미지 생성 모델이 생성한 인포그래픽. 미국 샌프란시스코에 왜 안개가 많이 끼는지를 그림과 글로 표현했다. 오픈AI 제공


'정확한 표현'에 강한 그래픽 디자이너


오픈AI는 전날 일부 기자들을 대상으로 간담회를 열고 최신형 AI 모델 'GPT-4o'를 기반으로 개발된 이미지 생성 모델을 이날부터 챗GPT에 도입한다고 밝혔다. 지금까지 챗GPT에 이미지 생성을 주문하면 달리3(DALL-E 3)가 동원됐지만, 이제는 GPT-4o 이미지 생성 모델이 기본적으로 작동한다. 엄청나게 많은 양의 이미지를 집중적으로 학습한 달리와는 달리, 새 모델은 글과 이미지를 모두 학습한 멀티모달(시각, 청각 등 다양한 감각을 통해 정보를 주고받는 것) AI여서 '말귀'를 더 잘 알아듣고 '글 생성'도 잘한다는 게 특징이다. 달리가 예술적 표현에 능한 화가라면, GPT-4o 이미지 생성 모델은 정확한 이해와 표현에 강점이 있는 그래픽 디자이너인 셈이다.
한국일보

뉴턴의 프리즘 실험을 자세히 설명하는 인포그래픽을 만들어줘라고 달리(위 사진)와 GPT-4o 이미지 생성 모델에 주문했을 때 생성해낸 이미지. 달리의 경우 글자를 전혀 알아볼 수 없게 생성한 반면, 새 모델은 그림과 설명 모두 명료하게 표현해 냈다. 챗GPT 캡처·오픈AI 제공


이날 오픈AI가 공개한 예시 이미지들을 보면, GPT-4o 이미지 생성 모델은 △복잡하고 구체적인 명령도 정확하게 이해하며 △사람 손가락을 6개로 표현하는 것과 같은 기본적인 실수를 하지 않고 △글자도 깨짐 없이 완벽에 가깝게 표현한다. 가령 "뉴턴의 프리즘 실험을 자세히 설명하는 인포그래픽을 만들어줘"라고 주문했을 때 달리의 경우 철자나 내용이 틀린 글, 심지어는 읽기 자체가 불가능한 외계어를 생성해 낸 반면, 새 모델은 그림과 설명 모두 명료하게 표현해 냈다. 정보를 담은 교육용 그래픽이나 홍보용 팸플릿, 웹툰 등 제작에 활용할 수 있다는 게 오픈AI의 설명이다.

오픈AI의 GPT-4o 이미지 생성 모델이 생성한 '맛차 만드는 법' 이미지. 글자를 깨짐 없이 표현하고, 그림과 해당 그림을 설명하는 글을 정확하게 연결시켰다. 오픈AI 제공

<이미지를 클릭하시면 크게 보실 수 있습니다>


챗GPT 무료 이용자도 쓸 수 있다


새 모델은 챗GPT 무료 이용자들도 사용할 수 있다. 단 무료 이용자의 경우 제한된 개수의 이미지만 생성할 수 있다고 오픈AI 측은 밝혔다. 오픈AI 관계자는 "한글도 표현이 가능하지만 알파벳에 비해서는 정교함이 떨어질 수 있다"고 말했다.

테크업계에서는 GPT-4o 이미지 생성 모델의 출시로 이미지 생성 AI 도구의 접근성과 활용성이 극대화할 것이라는 전망이 나온다. 이에 따라 AI의 일자리 위협에 대한 그래픽 디자이너들의 위기감은 더 커질 것으로 보인다.


실리콘밸리= 이서희 특파원 shlee@hankookilbo.com


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.