컨텐츠 바로가기

03.28 (목)

음성인식 전문가 "바이든 안들린다…MBC, 엉터리 자막 변조"

댓글 1
주소복사가 완료되었습니다
중앙일보

지난 22일 MBC 뉴스데스크에서 윤석열 대통령의 뉴욕 발언을 다룬 화면. 사진 MBC 유튜브 캡처

<이미지를 클릭하시면 크게 보실 수 있습니다>


윤석열 대통령의 순방 과정에서 불거진 비속어 논란에 대해 성원용 서울대학교 전기·정보공학부 명예교수는 “문제의 핵심은 데이터 변조”라고 분석했다.

성 명예교수는 지난 28일 자신의 페이스북을 통해 “엉터리 자막은 음성 편집 변조와 비슷한 역할”이라며 이같이 밝혔다.

그는 “왜 어떤 사람에게는 ‘바이든’이라고 들리는데, 다른 사람에게는 그렇지 않게 들릴까. 나의 경우, 그 소리를 직접 여러 번 들었는데, 절대 저렇게 들리지 않는다”며 “당연 ‘바이든’이라고 듣는 사람들의 귀가 더 예민하다 믿을 근거는 없다”고 설명했다.

이어 “나는 오랫동안 음성인식을 연구했는데, 음성인식은 단지 귀에 들리는 소리에만 의존하지 않는다”며 “왜냐하면 사람들의 발음이 너무 엉터리이기 때문”이라고 부연했다.

성 명예교수는 “윤 대통령의 뉴욕 발언은 매우 잡음이 많고 불분명한데, 여기에 MBC는 자의적으로 자막을 달아서 송출했다”며 “당연 대부분의 사람들은 이 자막대로 듣는다. ‘소리’를 따라 듣지 않고, ‘자막’을 따라 듣는다. 자막은 매우 선명한 사전정보 역할을 하기 때문”이라고 지적했다. 이어 “자막이 있는 외국어 방송은 잘 들리는데 이 또한 마찬가지 이유”라며 “‘바이든’이라고 들린다는 사람이 많은데, 이미 자막을 보았기 때문”이라고 했다.

그는 “대통령의 발언을 자동음성인식기에 넣어봤는데 내가 시험한 어떤 음성인식기에서도 ‘바이든’이라는 단어를 찾을 수 없었다”며 “가장 정확한 네이버 클로버 음성인식기에서 나온 답은 ‘신인 안 해주고 만들면 쪽팔려서’다”라고 했다.

성 명예교수는 “연구자 윤리에서도 데이터 변조는 최악의 위반으로 간주한다”며 “물론 대통령이 사용한 일부 단어는 좀 거칠다 생각할 수도 있지만, 엉터리 자막 편집과 비교할 사항이 아니다”라고 짚었다.

그러면서 “무엇보다도 야당이나 일부 언론도 이 사항을 가지고 MBC를 옹호할 일이 아니다”라며 “데이터변조가 언론의 자유와 혼동이 된다면 정직과 투명, 논리적 설득이 아니라 거짓말과 술수, 선동이 난무하는 세상이 될 것”이라고 했다.

중앙일보

성원용 서울대학교 전기·정보공학부 명예교수가 지난 28일 자신의 페이스북에 쓴 글. 사진 페이스북 캡처

<이미지를 클릭하시면 크게 보실 수 있습니다>


성 명예교수는 오랜 기간 음성인식 분야를 연구해오며 단어길이 최적화와 음성인식에 몰두해왔다. 2018년 ‘구글 AI 집중연구 어워즈’에서 ‘다중시간단계 병렬화를 이용한 저전력 디바이스에서의 음성인식’ 연구로 상을 수상한 바 있다.

한영혜 기자 han.younghye@joongang.co.kr

중앙일보 '홈페이지' / '페이스북' 친구추가

넌 뉴스를 찾아봐? 난 뉴스가 찾아와!

ⓒ중앙일보(https://www.joongang.co.kr), 무단 전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.