컨텐츠 바로가기

03.28 (목)

[써보니] '이 목소리가 가짜?'...사람 흉내내는 AI

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[서울=뉴스핌] 김지완 정윤영 기자 = "뽀미가 진짜 말하는 것 같아요."

반려견으로 말티즈 '뽀미'를 5년째 키우고 있는 정윤영 뉴스핌 기자가 자신이 제작한 더빙 영상을 본 뒤 함박 웃음을 지었다. 자칭 '뽀미엄마'로 반려견 '뽀미'와 대화를 나눠보는게 소원이라던 그는 네이버 클로바더빙으로 소원을 이뤘다. 클로바더빙이 반려견 '뽀미'에게 목소리를 선물한 셈이다.

네이버가 지난 10일 동영상에 인공지능 목소리를 더빙할 수 있는 '클로바더빙'을 내놨다. 유튜버들에겐 희소식이 아닐 수 없다. 그간 유튜버들은 자신이 촬영·편집한 영상을 보면서, 따로 녹음을 진행했다. 이젠 그럴 필요가 없어졌다. 영상에 맞춰 텍스트를 입력하면 자연스러운 인공지능(AI) 목소리로 더빙이 가능해졌기 때문이다.

특히 발음이 부자연스럽거나, 목소리가 탁하거나, 사투리 억양이 심했던 유튜버들에겐 희소식이다. 또 성우를 이용하기에 부담스러웠던 영세 영상제작자들에게도 큰 도움이 될 것으로 보인다.

뉴스핌

[서울=뉴스핌] 김지완 기자 = 네이버 클로바더빙 화면. [캡쳐=김지완 기자] 2020.02.20 swiss2pac@newspim.com

<이미지를 클릭하시면 크게 보실 수 있습니다>


사실 이 기술은 네이버가 처음은 아니다. 하지만 기존의 AI 목소리는 1~2가지 불과하고, 부자연스러웠다. 유튜브 영상을 보다가도 인공지능 목소리가 나오면, 거부반응으로 인해 다른 채널로 넘어가는게 일상이었다.

하지만 네이버 클로바더빙은 한차원 높은 AI 목소리를 구현했다. 클로바더빙이 만들어낸 AI 목소리는 이전보다 훨씬 사람의 목소리에 가까웠다. 평소 '이북(E-BOOK)'에서 '읽어주기' 기능을 통해, AI 목소리를 계속 접해왔던 기자 입장에선 클로바더빙 목소리가 훨씬 더 편안하게 느껴졌다.

'듣기 편안한 목소리'라는 합격점을 뒤로 하고, 살펴 본 클로바더빙 기능은 실로 놀라웠다.

우선 이용자들은 전체 21개의 목소리를 이용해 더빙을 할 수 있다.

클로바더빙은 아라, 지윤, 수진, 진호, 민상, 신우, 지훈, 하준, 다인 등 총 9개의 목소리를 제공한다. 이 목소리는 다시 아라 기쁨, 아라 슬픔, 아라 낮은톤, 지윤 높은톤, 수진 높은톤, 진호 높은톤, 민상 낮은톤, 지훈 낮은톤, 하준 높은톤, 하준 낮은톤, 다인 높은톤, 다인 낮은톤 등으로 세분화된다.

호흡 조절도 가능하다. '쉼표'로 문장에 여유로운 호흡을 더해주거나 마침표, 물음표, 느낌표로 문장을 자연스럽게 끝 맺을수 있다.

'AI 목소리'라는 익명성 악용에 대비해, 안전장치도 확실하게 걸어놨다. 클로바더빙은 욕설, 비속어 등이 문장에 포함될 경우 합성음이 생성되지 않도록 막아놨다.

'자동저장' 기능도 편리했다. 클로바더빙은 작업중 실수로 컴퓨터 전원이 꺼지거나, 지워지는 상황을 예방했다. 영상 제작 자체가 상당한 에너지를 소모하는 일이기 때문에, 이 경우 대부분의 작업자들은 패닉에 빠진다. 네이버는 클라우드에 실시간으로 작업물을 저장해, 실수로 날리는 일을 방지했다.

물론 약간의 아쉬움도 있다. '자르기' 등의 기본적인 영상 편집기능이 없어 다른 편집기를 사용해야 한다는 것이 불편했다. 단어에 따라 목소리가 부자연스러운 경우가 종종 있었다.

아래는 정윤영 기자가 네이버 클로바더빙을 이용해 만든 반려견 '뽀미소개' 영상이다. 이 영상에서 뽀미는 '다인 높은톤', 정 기자는 '아라 기쁨톤'을 사용했다.



swiss2pac@newspim.com

저작권자(c) 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.