미국 핀드롭 시큐리티가 AI로 생성된 음성을 감지할 수 있는 새로운 기술을 공개했다. [사진: 셔터스톡] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 인공지능(AI) 기술이 발전하면서 사람의 목소리를 모방하는 능력이 높아지고 있는 가운데, 글로벌 음성기술 기업 미국 핀드롭 시큐리티(Pindrop Security)가 AI로 생성된 음성을 감지할 수 있는 새로운 기술을 공개했다.
26일(현지시간) 블룸버그에 따르면 핀드롭의 기술은 오디오를 분석하여 음성이 진짜 사람인지, 아니면 사람을 모방한 AI 기술인지 판단한다.
발라 수브라마니얀 핀드롭 공동설립자에 따르면 인간은 특정한 소리를 내어 말을 하고, 그 소리가 단어를 형성한다고 한다. 하지만 기계는 인간과 같은 방식으로 소리를 내지는 않으며, 간혹 인간의 입이 소리를 내는 물리적 한계를 벗어나는 변형을 생성하기도 한다. 음성 오디오에는 매초마다 8000개의 샘플이 포함되기 때문에 AI로 생성된 지점을 발견할 수 있는 부분은 수천 개에 달한다고 수브라마니얀은 설명했다.
발라수브라마니얀은 "점점 더 많은 오디오를 확보할수록 이러한 이상 징후가 눈에 띄기 시작한다"라며 "모든 사람이 같은 방식으로 소리를 내기 때문에 자사 오디오 탐지 소프트웨어는 언어에 구애받지 않는다"라고 덧붙였다. 그는 자사 오디오 탐지 도구가 99%의 정확도로 AI 생성 오디오를 식별할 수 있다고 주장했다.
한편 업계 내에서는 AI 탐지의 한계에 대한 논쟁이 계속되고 있다. 일부는 AI 문제를 해결하기 위해 또 다른 AI 기업이 늘어나는 것에 대해 우려를 표명하고 있다. 보안 기술이 발전함에 따라 위협도 진화할 것이며, 악의적인 공격자들이 핀드롭과 같은 회사가 딥페이크를 식별하는 데 사용하는 검사를 회피하는 알고리즘을 훈련시킬 수 있다는 주장도 있다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.