![]() |
챗GPT 달리 |
미국 인공지능(AI) 기업 앤트로픽이 자사 AI 모델 ‘클로드’에 새로운 음성 기능을 탑재할 것이란 소식이 전해지면서 ‘AI 음성 비서’ 시장 선점 경쟁이 치열해질 전망이다. 주요 IT 기업들은 사람이 말로 지시한 내용을 인식·이해한 뒤 답변을 내놓거나 작업을 수행하는 AI 음성 비서의 성능을 고도화하는 데 박차를 가하고 있다. 생성형 AI를 접목한 음성 비서가 스마트홈, 자동차, 웨어러블 기기 등 일상에서 자주 접하는 이동 수단과 기기, 서비스에 통합되고 있어 앞으로 확장 가능성이 높다고 보기 때문이다.
17일 블룸버그통신에 따르면 앤트로픽은 ‘보이스 모드(voice mode)’라는 기능을 이달 중 출시할 예정이다. 보이스 모드에는 에어리(airy), 멜로우(mellow), 그리고 영국 억양의 버터리(buttery) 세 가지 종류의 음성이 포함될 것으로 전해졌다.
앤트로픽은 그간 클로드용 AI 음성 기능을 개발 중이라고 했지만, 구체적인 출시 일정은 밝히지 않았다. 마이크 크리거 앤트로픽 최고제품책임자(CPO)는 지난달 파이낸셜타임스(FT)와의 인터뷰에서 “이용자들이 AI 모델과 대화하듯 소통할 수 있는 음성 기능을 준비하고 있다”라고 말했다. 그러면서 이미 AI 음성 기능을 보유한 기업들과 협력 중이라고 덧붙였다.
업계에서는 앤트로픽이 경쟁사인 오픈AI와의 격차를 좁히기 위해 AI 음성 기능 개발에 속도를 내고 있다고 보고 있다. 오픈AI는 2023년에 ‘챗GPT 보이스 모드’를 공개했고, 지난해 한국어를 포함한 50개 이상의 언어를 인식하는 고급 음성 기능 ‘어드밴스드 보이스 모드’를 선보였다. 영어와 한국어 사투리까지 인식해 주목을 받았다.
![]() |
그래픽=정서희 |
앤트로픽까지 가세하면서 빅테크의 새 격전지로 부상한 AI 음성 비서 시장 선점 경쟁에도 불이 붙을 것으로 예상된다. 메타도 “AI 에이전트(비서)의 미래는 텍스트(글) 기반이 아닌 음성 중심의 대화형이 될 것”이라며 자사 AI 모델 라마의 음성 기능을 강화하기로 했다.
업계가 AI 음성 비서에 주력하는 이유는 음성이 AI 서비스의 접근성을 높이고 대중화에 기여하는 관문 역할을 하기 때문이다. 실제 아마존 ‘알렉사’, 구글 ‘어시스턴트’, 애플 ‘시리’, 삼성전자 ‘빅스비’ 등의 AI 음성 비서 서비스는 집 안의 조명을 끄거나 문자를 보내고, 음악 재생과 길 안내를 요청하는 등 일상 생활 곳곳에서 활용된다.
삼성전자는 지난달 AI 기능을 탑재한 프리미엄 가전 제품 라인 ‘비스포크 AI’ 신제품을 공개하면서 개선된 음성 인식 기능을 강조했다. 냉장고에 “문 열어줘”라고 하면 AI가 음성을 인식해 냉장고 문이 자동으로 열리는 식이다. 가족 구성원의 목소리를 구분해 인식하는 ‘보이스ID’ 기능으로 한 단계 향상된 빅스비로 이용자 편의를 높였다.
KT도 마이크로소프트(MS)와 손잡고 IPTV 서비스 지니TV에 AI 음성 비서 기능을 심을 계획이다. 일례로 “ENA 채널에서 방영한 군대 배경의 유쾌한 드라마가 뭐였지?”라고 물으면 AI 비서가 지니 TV 오리지널 드라마 ‘신병’을 찾아준다.
이처럼 AI 음성이 다양한 기기는 물론, 생태계와의 협업이 가능하기 때문에 향후 AI 기업 수익화 전략의 한 축이 될 것으로 예상된다. 실제 아마존은 AI 음성 비서 서비스인 ‘알렉사+’의 성능을 높이기 위해 앤트로픽의 기술을 활용 중이다.
이재은 기자(jaeeunlee@chosunbiz.com)
<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.