여러 캐릭터·복잡한 장면, 영상 생성
오픈AI CEO "일부 창작자만 먼저 사용"
가짜뉴스·혐오 콘텐츠 관련 안정성 여부 평가
오픈AI가 공개한 텍스트 입력으로 만든 영상.(사진=오픈AI 홈페이지 갈무리) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
마이크로소프트가 최대 주주인 오픈AI는 15일(현지시간) 텍스트를 입력하면 최대 1분짜리 동영상을 만들어주는 인공지능(AI) ‘소라(Sora)’를 공개했다.
소라는 여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 정확한 묘사가 포함된 복잡한 장면을 생성할 수 있다. 단일 동영상 내에서 여러 장면을 만들 수도 있다. 또한 정지 이미지에 애니메이션을 적용할 수 있다고 회사 측은 설명했다.
다만 복잡한 장면을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있고, 원인과 결과의 특정 사례를 이해하지 못할 수 있다고 오픈AI 측은 전했다. 예를 들어 쿠키를 한 입 베어 물었을 때 쿠키에 자국이 없을 수 있다는 것이다. 또한 공간 세부 정보를 혼동할 수 있으며, 특정 카메라 궤적을 따라가는 등 시간이 지남에 따라 발생하는 이벤트를 정확하게 설명하는 데 어려움을 겪을 수 있다.
샘 올트먼 오픈AI 최고경영자(CEO)는 엑스(X·옛 트위터)에서 “처음에는 제한된 수의 창작자만 사용할 수 있도록 허용된다”고 밝혔다.
오픈AI는 소라를 회사의 제품에 통합하기 전 전문가팀에 맡겨 안전성 여부를 평가할 계획이다. 잘못된 정보와 혐오 콘텐츠 등에 대해 전문가팀과 협력해 테스트를 진행할 예정이다.
오픈AI 측은 “전 세계의 정책 입안자, 교육자, 예술가들의 우려를 이해하고 이 새로운 기술에 대한 긍정적인 사용 사례를 파악하기 위해 노력할 것”이라고 밝혔다. 이어 “광범위한 연구와 테스트에도 불구하고 사람들이 기술을 사용하는 유익한 방법이나 악용할 수 있는 모든 방법을 예측할 수 없기 때문에 실제 사용 사례를 통한 학습은 시간이 지남에 따라 더욱 안전한 AI 시스템을 만들고 출시하는 데 있어 매우 중요한 요소”라고 덧붙였다.
앞서 페이스북 모회사 메타와 구글, 스타트업 런어웨이 AI 등도 ‘텍스트 투 비디오’(Text to Video) 모델을 개발한 바 있다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.