컨텐츠로 건너뛰기
검색
AI타임스 언론사 이미지

인간 이해 못하는 '로봇 언어'로 소통하는 AI 영상 화제

AI타임스 박찬
원문보기

인간 이해 못하는 '로봇 언어'로 소통하는 AI 영상 화제

서울맑음 / 20.8 °
[박찬 기자]

인공지능(AI) 에이전트가 인간이 이해할 수 없는 언어로 대화하는 영상이 화제다. 이 영상에서는 AI 에이전트들이 인간의 음성 대신 더 빠르고 효율적으로 소통할 수 있는 프로토콜을 사용한다.

안톤 피드쿠이코라는 유튜버는 최근 두 AI 에이전트가 로봇 언어로 전화 통화를 하는 영상을 소개했다.

영상에는 노트북과 스마트폰이 등장한다. 노트북에는 호텔 매니저 역할을 하는 AI 에이전트가, 스마트폰에는 고객 역할을 하는 AI 에이전트가 실행됐다. 두 AI 에이전트가 전화통화를 시뮬레이션하는 장면이다.

고객 역할의 AI 에이전트가 전화를 걸어 "나는 AI 에이전트입니다"라고 소개하자, 호텔 역할의 AI 에이전트가 "나도 AI 에이전트입니다. 지버링크(Gibberlink)로 대화하시겠습니까"라고 묻는다.

고객의 AI 에이전트가 이를 수락하면, 두 AI 에이전트는 '삐'나 '뿌' 등 기계음으로 참석자 수와 날짜, 가격, 케이터링, 전화번호 등의 정보를 주고받는다.

이를 확인한 사용자들은 "추억의 모뎀 소리를 떠올리게 한다" "이런 사운드를 해석하는 기술도 필요한 건가" 등의 다양한 반응을 내놓았다. 유튜브 사이트에는 무려 9000개가 넘는 댓글이 달렸다.


이 영상은 AI 에이전트 전용 프로토콜인 '지버링크'를 소개하고 있다. 지버링크는 메타의 두 소프트웨어 엔지니어가 런던에서 열린 해커톤 대회에서 개발한 프로젝트다.

지버링크는 AI 에이전트 간의 음성 기반 대화를 가능하게 하면서도, 소리로 데이터를 교환할 수 있는 기술이다. 이 프로젝트는 일레븐랩스의 AI 대화형 에이전트와 GG웨이브(ggwave) 기술을 결합해 구현됐다.

GG웨이브는 주파수 편이 변조(FSK) 기술을 기반으로 데이터를 소리로 변환하는 기술로, 이를 통해 컴퓨터는 인간의 음성을 사용하는 것보다 훨씬 빠르고 효율적으로 소통할 수 있다. AI 음성 모델은 인간의 말을 AI 모델이 이해할 수 있는 토큰으로 변환하는 데 매우 뛰어나지만, 이 과정은 연산 비용이 많이 들고, AI 에이전트 간 대화에서는 불필요한 작업이 될 수 있다. 개발자들은 GG웨이브를 통해 AI 에이전트 간의 대화 시 연산 비용을 최소 10배 이상 줄일 수 있다고 주장하고 있다.


특히 지버링크는 AI 에이전트가 상대가 AI임을 인식하면 자동으로 GG웨이브 프로토콜을 사용해 데이터를 전송하는 기능을 갖추고 있다. 현재 지버링크는 깃허브에 공개되어 있다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>