클로바 스피치에 적용
<이미지를 클릭하시면 크게 보실 수 있습니다> |
‘더 이상 힘들게 자막 타이핑하지 마세요’
네이버클라우드는 인공지능(AI) 기반으로 음성을 텍스트로 변환하는 서비스인 기업용 ‘클로바 스피치’(CLOVA Speech)에 실시간 방송 속 화자의 음성을 추출해 바로 자막을 생성하는 ‘실시간 스트리밍’ 기능을 출시했다고 2일 밝혔다.
네이버클라우드에 따르면, 클로바 스피치는 높은 수준의 한국어 인식률과 빠른 인식 속도를 보이는 음성 텍스트 변환(Speech-to-text, STT) 서비스로, 네이버 클라우드 플랫폼에서 운영 중인 기업용 제품이다.
현재 이 서비스는 네이버 뉴스의 자동 자막 생성 기능, 네이버 쇼핑라이브, 고객센터 통화 데이터 관리 등에 적용됐다.
이번에 신규 기능으로 출시된 실시간 스트리밍은 라이브 방송과 같은 실시간 스트리밍 영상에서 화자가 말하는 내용을 즉시 텍스트로 추출해주는 기술이다. 한국어, 영어, 일본어 3개 국어를 지원하며 음성의 어절 단위로 텍스트가 형성된다.
이와 관련 회사 측은 “현재 생방송 실시간 자막 서비스는 속기사가 일일이 작성한 자막이 제공되고 있으나 실시간 스트리밍 기술을 활용한다면 별도 타이핑 작업 없이 실시간으로 자막을 송출할 수 있다”고 설명했다.
이어 “고객센터에서도 통화 내용을 즉각 텍스트화해 모니터링 할 수 있어 보다 빠른 고객 대응이 가능해진다”고 강조했다.
한편 네이버클라우드는 실시간 스트리밍 신규 출시에 맞춰 다양한 사용자 수요에 맞춘 옵션을 제공하고, 더 많은 고객들이 이용할 수 있도록 서비스 요금을 인하했다고 밝혔다.
음성인식과 화자인식 비용의 경우 기존보다 비용을 40% 낮췄으며, 단일 요금제로 제공하던 것을 음성인식, 화자인식, 이벤트탐지(박수, 음악, 함성 등 인지)로 기능을 나눠, 각 기능별로 요금을 세분화해 고객이 필요한 기능에 맞춰 선택할 수 있게 했다고 회사는 설명했다.
아울러 영어 발음의 정확도를 판단해주는 기능도 선택 옵션으로 추가됐다.
김성훈 네이버클라우드 AI 상품기획 매니저는 “실시간 스트리밍 기능은 방송사, 라이브커머스 기업, 유튜버 등 실시간 방송을 필요로 하는 산업군에서의 활용도가 높을 것으로 예상한다”면서 “앞으로도 AI 기반의 클로바 서비스를 고도화시켜 기업 비즈니스 성장에 도움이 될 수 있도록 지원하겠다”고 말했다.
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.