이 벨기에 방송사는 네덜란드어 오디오 파일이 구글 직원들에 의해 누출된 이후 해당 녹음 파일을 입수했다. VRT 측은 이 파일군에서 구글 어시스턴트 발췌 내용이 1,000개 이상이었으며, 주소를 비롯한 기타 민감 정보들을 명확하게 들을 수 있었다고 전했다. 또 여러 녹음 파일이 누구로부터 생성된 것인지 연결지을 수 있었다고 밝혔다.
일종의 프라이버시 침해 사건처럼 들리지만 구글은 이 사건이 데이터 누출 문제라고 블로그 포스트를 통해 밝혔다. 구글은 어시스턴트 개발에 필수적으로 수반되는 녹음 과정이라고 강조하며, 그러나 내부 보안 측면에서 문제가 있을 수 있다고 인정했다.
구글의 포스트에는 “방금 내부 언어 감수자가 기밀 네덜란드 오디오 데이터를 누출해 내부 데이터 보안 정책을 위반했다는 사실을 파악했다. 당사의 보안 및 개인 정보 대응 팀이 이 문제를 조사 중이며 조취를 취할 것이다. 이와 같은 위법 행위가 다시 발생하지 않도록 우리의 안전 장치를 완전히 검토하고 있다”라고 게재돼 있다.
구글은 또 내부 언어 전문가들이 전체 오디오 더미의 0.2%만 감수한다며, 감수 프로세스의 일환으로 녹음 파일이 해당 파일을 사용자 계정과 연관되지 않는다고 전했다. 아울러 전체 오디오 더미에서 무작위로 추출되고 감수자들은 배경 소음 및 대화를 기록하지 않으며 어시스턴트에 지시한 오디오 영역만 기록해 구글에 전달한다는 설명이다.
이러한 구글의 해명은 직원들에 대한 신뢰를 전제하는 한편, 회사가 관련 정책을 바꿀 의사가 없음을 시사하는 것으로 관측된다. 구글은 또 사용자가 3개월 또는 18개월마다 데이터를 자동 삭제할 수 있는 도구들이 있음을 언급했다. 그러나 그러한 도구를 이용한다고 할지라도 프라이버시 우려를 얼마나 해소할 수 있을지 여전히 불확실한 상태다.
VRT 보도에 따르면 ‘헤이 구글’ 메시지가 없었음에도 대화가 녹음된 몇 가지 사례가 발견됐다. 이는 심각한 프라이버시 관련 우려를 제기할 수 있는 문제다. 이에 대해 구글은 자사의 인공지능 스피커가 유사한 문구를 듣고 활성화되는 ‘오접수’(false accept) 현상이라고 주장했다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
구글 홈 상단의 LED 표시등은 이 기기가 발화자의 말을 듣고 있음을 나타낸다.
구글의 설명은 논리적이며, 인공지능 스피커 이용자라면 누구나 경험할 수 있는 현상이기는 하다. 그러나 안심해도 된다는 의미로 이어지지는 않는다. 구글 직원들이 ‘오접수’를 포함해 녹음 파일을 랜덤으로 들을 수 있다는 사실이 확인된 셈이기 때문이다. 즉 일반 사용자들이 노출을 원치 않는 녹음 파일이 구글 직원들에게 공개될 수 있다.
구글은 ‘여러 보호 장치’를 배치해 우발적인 녹음을 방지한다고 설명하고 있지만 VRT에 따르면 부모와 자녀 사이의 대화를 비롯해 여러 언쟁, 개인 정보 다수를 담은 통화 내용 등이 담겨진 사례가 분명히 존재했다.
또 사용자가 스스로를 보호할 대안은 사실상 없다. 마이크를 차단해 구글 홈 스피커가 아예 듣지 못하게 하는 방법 뿐이다. 녹음 내용이 녹취되지 않도록 선택 해제할 방법도 없다.
구글이 음원 분석을 위해 언어 전문가를 필요로 하는 것을 납득할 수 있다. 그러나 적어도 구글 어시스턴트 쿼리를 통해 녹음된 파일만 녹취되도록 조치가 필요가 있을 것이다. ciokr@idg.co.kr
Michael Simon editor@itworld.co.kr
저작권자 한국IDG & ITWorld, 무단 전재 및 재배포 금지
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.