컨텐츠 바로가기

03.28 (목)

AI스피커, 아직도 TV리모컨으로 쓰시나요?

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
매일경제

SK텔레콤의 'T전화x누구' 서비스

<이미지를 클릭하시면 크게 보실 수 있습니다>


"어서와요, 기다리고 있었어요. 지금은 오후 8시 15분이에요. 취향을 반영한 음악을 추천해드릴게요."

스마트폰에서 SK텔레콤의 전화 플랫폼 'T전화'를 누른 뒤 "아리아, 다녀왔어" 라고 말하자, 인공지능(AI) 음성비서 '누구(NUGU)'가 반갑게 답한다. 요 며칠사이에 들었던 환불원정대의 '돈 터치미'를 틀어준다. 개인비서처럼 오삼불고기, 꽁치김치찜, 파무침 같은 저녁 메뉴도 추천한다. 저녁 주요 뉴스부터 코스닥지수, 외국인이 가장 많이 판 종목까지 주가 정보도 줄줄이 설명한다. 내일 일정도 시간과 장소, 내용 까지 꼼꼼하게 알려준다. "너무 피곤하다"며 한숨을 쉬자 "깊은 잠을 자야할 것 같아요"라는 답이 돌아온다.

SK텔레콤이 최근 출시한 AI 지능형 전화서비스 'T전화×누구'의 장면이다. T전화와 누구를 결합하는 형태로 스마트폰 안에 자사의 AI음성비서를 집어넣었다. AI가 폰 이용 패턴, 위치, 날씨, 시간 같은 이용자 데이터를 분석해 맞춤형 콘텐츠를 추천하고 말로 설명한다.

매일경제

구글 최신 AI스피커 Nest Audio


이처럼 AI 음성비서가 보다 빠르게 진화하고 있다. 초기엔 음성 인식 오류가 잦았지만, 최근에는 자연스런 대화뿐 아니라 상황 인식까지도 가능하다. 그간 AI 음성비서는 자동차를 비롯해 현관문, TV, 조명, 에어컨, 냉장고, 세탁기, 온도조절장치 같은 제품과 연동해 AI스피커를 통해 음성명령으로 켰다 껐다하는 제어 역할에 집중해왔다. 하지만 최근 AI기능이 지능화하면서 이용자와 소통하며 '나를 도와주고 내 일을 대신해주는' 개인비서로 발전하고 있다.

SK텔레콤의 'T전화×누구'는 음성만으로 문자 메시지를 보낼 수 있다. '속사포 랩'처럼 말한 내용을 띄어쓰기까지 적용해 정확하게 텍스트로 바꾼다. 내년부터 음성과 텍스트가 쌍방향 전환되는 '컨버터블 콜(가칭)'을 이용하면 강의실이나 도서관, 사무실에서 회의 중에 전화가 걸려올 때 수신거절 메시지를 보내는 대신 문자를 입력한 대로 AI 음성비서가 말해주는 방식으로 통화를 할 수 있다. 또 통화 녹음을 텍스트로 옮기고 검색·요약도 가능하다. SK텔레콤은 2022년 상반기엔 모임의 종류와 규모, 예산, 선호 메뉴, 장소를 종합적으로 판단해 AI비서가 레스토랑을 추천하고 예약, 주문, 결제를 하는 시스템도 구축할 예정이다.

AI음성 비서가 똑똑해진 배경에는 5G(5세대) 통신서비스, 클라우드 솔루션, 슈퍼컴퓨터 같은 정보통신기술(ICT)의 고도화가 자리잡고 있다. AI가 방대한 음성 데이터를 더욱 빠르게 처리할 수 있는 여건이 조성된 셈이다.

삼성의 빅스비는 구글 클라우드의 머신러닝 솔루션인 TPU(Tensor Processing Unit)를 도입했다. 그동안 약 180시간에 걸쳐 처리했던 학습량을 이젠 10시간 만에 해치운다. 음성인식 정확도와 반응 속도가 개선됐다는 평가가 나온다.

네이버는 국내 기업 최초로 슈퍼컴퓨터를 구축해 한국어와 일본어에 대한 '초거대 언어 모델'을 만들기로 했다. 이 슈퍼컴퓨터는 700페타플롭(Petaflop·1초당 1000조번의 수학 연산을 처리) 이상의 성능을 갖췄다. 더 자연스러운 언어처리가 가능해 AI기술 수준이 향상된다는 게 네이버 설명이다. 네이버가 최근 선보인 AI 스마트 조명 '클로바 램프'는 딥러닝 기술을 활용한 광학문자판독(OCR)과 음성·이미지 인식 같은 다양한 AI기술이 녹아있다. 램프 아래 책을 펼쳐 놓으면 AI가 글자를 인식하고 읽어준다. 여성 목소리의 AI는 텍스트를 바탕으로 기쁨과 슬픔의 감정도 표현한다.

글로벌 IT(정보기술)기업도 AI음성비서 시장에서 각축전을 벌이고 있다. 최근 아마존, 구글, 애플 같은 '빅3'가 최신 AI스피커를 내놨다. 미국 월스트리트저널(WSJ)을 비롯한 외신은 "빅테크들의 AI 스피커 대전이 펼쳐지고 있다"고 전했다.

매일경제

아마존의 최신 AI스피커 아마존 에코

<이미지를 클릭하시면 크게 보실 수 있습니다>


AI 음성비서 최강자인 아마존은 최신 AI스피커 '아마존 에코(Amazon Echo)'에 자체 개발한 프로세서를 탑재해 AI비서 알렉사의 음성인식 수준을 2배 이상 향상시켰다. 외신을 종합하면 아마존 알렉사는 이용자에게 '다시 물어보기' 기능을 탑재했다. 지금까진 AI음성비서가 이용자의 말을 못 알아들으면 "잘 모르겠어요"라고 답하고 '상황 종료'였지만, 이제 알렉사는 이용자에게 무슨 말인지 계속 되묻는다. 임기응변에 강한 알렉사가 될 것이란 게 아마존 측 설명이다. 게다가 알렉사는 추가 질문을 던지면서 이용자의 취향을 학습하고 얼마 뒤 실천에 옮긴다.

예를 들어 이용자가 "스터디 모드로 조명을 켜줘"라고 명령하면 알렉사는 "어떤 밝기로 할까요"라고 묻는다. 이용자가 "80%의 밝기로 해줘"라고 다시 요청하면 몇 주 뒤부턴 알렉사가 '스터디 모드'에선 자동으로 80%의 밝기로 조명을 켜주는 식이다. 아마존은 알렉사가 적절한 타이밍에 이용자의 대화에 끼여드는 '대화에 참여할게(join my coversation)' 기능도 선보일 예정이다. 아마존 관계자는 "AI가 대화 내용과 문맥, 목소리 톤, 주변의 시각적인 요소까지 복합적으로 분석해 최적의 타이밍에 대화에 참여하게 될 것"이라고 말했다.

구글의 최신 AI 스피커 '구글 네스트 오디오(Nest Audio)'는 스피커를 포함한 디바이스간 연동을 강화했다. 침실에서 스마트폰으로 듣고 있는 음악을 거실이나 부엌 같은 다른 공간에 있는 모든 스피커에서 동시에 틀 수 있다. 스마트폰에선 구글 어시스턴트를 불러내서 날씨, 일정, 뉴스, 팟캐스트, 유튜브를 이용자 취향에 맞게 추천하고 읽어주는 서비스도 제공한다. 구글은 머신러닝 기술로 이용자가 특정 정보의 필요성을 느끼기 전에 먼저 콘텐츠를 제공하는 서비스를 개발하고 있다.

매일경제

애플 Home pod mini

<이미지를 클릭하시면 크게 보실 수 있습니다>


애플도 최근 두번째 AI스피커인 '홈 팟 미니(Home Pod Mini)'를 내놨다. AI스피커에서 아이폰, 아이패드, 애플워치 같은 애플 전용 단말기에 음성 메시지를 보낼 수 있는 '인터컴' 기능을 탑재했다.

AI 음성비서가 일상에 파고들면서 AI 스피커 시장도 빠르게 성장하고 있다. 시장조사기관 스태티스타(Statista)는 AI스피커 세계 시장 규모가 올해 156억달러(약 17조6700억원)에서 2025년 355억 달러(약 40조2000억원)로 커질 것이라고 전망했다. 시장조사업체 스트래티지애널리틱스(SA)는 지난 2분기 세계 AI 스피커 판매대수를 3000만대로 집계했다. 이런 추세라면 올 한해 1억5000만 대 이상 팔릴 것으로 예상된다. AI스피커 세계 시장 점유율은 아마존이 54%로 압도적 1위이고, 2위인 구글(36%)이 뒤를 쫓고 있다.

통신업계 관계자는 "5G나 클라우드 같은 ICT 인프라를 기반으로 AI가 대량의 발화량을 학습하면서 음성 텍스트 변환(STT·Spech to Text)과 텍스트 음성 변환(TTS·Text to Speech) 같은 음성 인식 기술을 비롯해 자연어 처리, 추론 능력이 빠른 속도로 발전하고 있다"며 "우리 주변의 모든 것이 IoT(사물 인터넷)로 연결될 가능성이 높다는 점에서 AI음성비서가 개인비서를 넘어서 가족 구성원으로 자리매김할 가능성이 있다"고 말했다.

[임영신 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.