컨텐츠 바로가기

04.18 (목)

'말 걸기 좋은 타이밍' 아는 인공지능 나올까?

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

KAIST, 스마트 스피커의 선제적 서비스를 위한 상황맥락 파악 연구

아이뉴스24

스마트 스피커가 먼저 말을 거는 선제적 서비스. 용건만 바로 말하기보다는 "안녕하세요"와 같이 대화의 시작을 알리는 문장으로 말을 건다. [KAIST]

<이미지를 클릭하시면 크게 보실 수 있습니다>



[아이뉴스24 최상국 기자] 언제 말을 걸어야 할 지 아는 것은 사람에게도 무척 어려운 일이다. 인공지능은 언제 말하는 게 좋은지 알 수 있을까?

인공지능 스피커 사용이 늘어나면서 먼저 말을 거는 인공지능(AI)이 등장할 날도 머지 않았다는 사실은 누구나 느끼고 있다. 사람에게는 어려운 일을 인공지능은 쉽게 해내는 사례가 갈수록 많아지고 있는 게 현실이다.

공상과학 영화에서는 '먼저 말 거는 인공지능'이 흔하게 등장하지만 현실에서는 어떨까?

현재 시판 중인 스마트 스피커 인공지능 비서는 사용자가 먼저 부를 때만 응답한다. 분명히 앞으로는 사용자의 상황에 맞춰 능동적인 서비스를 제공하는 형태로 진화할 것이다. 사용자가 처해 있는 상황을 정확히 이해한 후에 선제적으로 일정 및 건강관리를 도와주는 똑똑한 음성비서 연구가 활발하다. 상황에 따라서는 유용하겠지만 아무 때나 눈치 없이 말을 건다면 도움은 커녕 하는 일에 방해만 될 수도 있다.

아이뉴스24

스마트 스피커는 다양한 선제적 서비스를 제공할 수 있다. 사용자가 명령하기 전에 스마트 스피커가 먼저 전등을 켜고 끄거나, 냉난방을 켜고 끄는 등 IoT 기기를 조작할 수 있다. 복약 시간이 되었을 때 알려주고 사용자의 일정을 파악해 일정 추가를 제안할 수도 있다. [KAIST]

<이미지를 클릭하시면 크게 보실 수 있습니다>



사람과 기계의 상호작용(HCI) 분야를 연구하고 있는 이의진 KAIST 전산학부 교수는 전산학부 이재길 교수, 산업디자인학과 이상수 교수와 공동연구팀을 구성해 스피커가 먼저 말을 걸면 사람들이 어떻게 반응하는지, 어떤 상황과 맥락에서 사람들이 받아들이고 아니면 거부하는지에 대한 연구를 진행하고 그 결과를 소개했다.

연구팀은 KAIST 기숙사에 거주하는 학생 40명(2인 1실)의 방에 스마트 스피커를 설치하고, 사용자의 움직임이 감지되거나 일정한 시간이 지나면 주기적으로 "지금 대화하기 좋은가요"라는 질문을 하는 방식으로 실험을 했다. 움직임이 있을 때는 바로, 움직임이 없을 때는 15분에서 25분 사이에 랜덤으로 말을 걸었다.

실험 참가자들은 대화하기 좋은지 아닌지를 "네" 또는 "아니요"로 대답하고 무엇을 하고 있었는지 설명했다. 물론 대꾸하지 않는 경우도 있었다. 연구진은 이를 통해 1주일간 총 3천500개의 사용자 응답 데이터를 수집했다. 응답 중에서 "네"가 53%, "아니요"가 47%였다.

아이뉴스24

대화하기 좋은 상황과 좋지 않은 상황 [KAIST]

<이미지를 클릭하시면 크게 보실 수 있습니다>



연구진은 사용자의 실내 활동을 19개의 범주로 묶고, 상황맥락 요인을 크게 개인적 요인과 움직임 요인, 사회적 요인으로 분류했다. '활동 집중도', '긴급함과 바쁨 정도', '정신적·육체적 상태', '다중 작업수행을 위한 듣기 또는 말하기 가능성' 등은 개인적 요인이다. 공부에 집중하고 있거나 드라이로 머리를 말리고 있을 때는 스피커와 대화하기 어렵다.

움직임 요인은 '외출', '귀가' 그리고 '활동 전환' 등 3가지다. 특히 사용자 움직임이 있을 때는 스피커와 대화 가능한 거리가 최적 시점 판단에 큰 영향을 미쳤다. 외출은 스피커와 대화 가능 범위 밖으로 나가는 움직임이고, 귀가는 범위 안으로 들어오는 움직임이다. 귀가 상황일 때는 대부분 대화하기 좋은 시점으로 분류됐다.

일반적으로 스마트 스피커는 거실처럼 함께 생활하는 공간에 설치된다. 수집된 사용자 응답 중 절반은 룸메이트가 함께 있을 때 수집됐다. 연구팀은 누군가와 함께 있다는 것 또한 스마트 스피커와 대화하기 좋은 시점에 영향을 끼친다는 현상을 발견했다. 룸메이트가 자고 있거나 어떤 활동에 집중하고 있을 때 스마트 스피커와의 대화로 인한 갈등을 최소화하고 싶기 때문이다.

이의진 교수는 "말 걸기 좋은 상황이란 사람마다 다르다. 이번 연구는 스마트 스피커 인공지능 비서가 선제적으로 말 걸기 좋은 최적의 시점을 결정하는 중요한 상황맥락 요인을 찾아내기 위한 출발점"이라고 설명했다.

다중 센서 데이터를 활용한 행동 및 맥락 감지 기술이 발전함에 따라 집에서의 행동을 감지하고 판단해 적절한 순간에 말을 거는 인공지능 비서는 언젠가 실현될 것이다. 귀가 시 스마트 도어락 또는 현관 모션 센서 등으로 귀가를 감지한 후 대화를 시작하는 알고리즘은 당장 적용할 수 있다.

이번 연구에 제1 저자로 참여한 차나래 학생은 "앞으로는 센서 데이터로 감지된 상황맥락 정보를 활용해 스마트 스피커가 스스로 대화를 시작·중지, 또는 재개하기 좋은 타이밍을 선제적으로 감지해 지능적인 음성서비스를 제공하게 될 것"으로 기대했다.

한편 이 연구는 유비쿼터스 컴퓨팅 분야 국제 학술지인 'Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies' 9월호에 게재됐다.

(논문명 : Hello There! Is Now a Good Time to Talk?: Opportune Moments for Proactive Interactions with Smart Speakers)

최상국기자 skchoi@inews24.com


[ⓒ 아이뉴스24 무단전재 및 재배포 금지]


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.