본문으로 바로가기
63739049 0372020102863739049 08 0805001 6.2.0-RELEASE 37 헤럴드경제 29182869 false true true false 1603857698000 1603857707000

사용자 의도 파악해 말 거는 똑똑한 ‘AI 비서’ 나온다

글자크기

- KAIST 전산학부 이의진 교수팀, 스마트 스피커 최적 발화 시점 추론 기술개발

헤럴드경제

사람이 말을 걸기 전에 먼저 말을 거는 스마트 스피커의 선제적 서비스 작동방식.[KAIST 제공]

<이미지를 클릭하시면 크게 보실 수 있습니다>


[헤럴드경제=구본혁 기자] #스마트 스피커가 사용자가 명령하기 전에 스스로 전등을 끄고 복약 일정을 알려주고, 비어있는 시간에 다른 일정을 추가하는 것을 선제적으로 제안한다.

이처럼 조만간 사용자의 의도를 정확하게 파악해 대화를 먼저 시작하는 똑똑한 인공지능(AI) 스피커 등장이 가능해 질 전망이다.

한국과학기술원(KAIST)은 전산학부 이의진 교수 연구팀이 스마트 스피커 인공지능 비서가 선제적으로 말 걸기 좋은 최적의 시점을 결정하는 중요한 상황맥락 요인을 찾아냈다고 28일 밝혔다.

기존 시판 중인 스마트 스피커 인공지능 비서는 사용자가 먼저 요청한 서비스만 제공하는 반면 최근 스마트 스피커의 개발은 사용자의 상황에 맞춰 능동적인 서비스를 제공하는 형태로 진화하는 추세다. 똑똑한 음성비서가 사용자가 처해 있는 상황을 정확히 이해한 후에 선제적으로 일정 및 건강관리를 도와주는 방향으로 개발되고 있는 것이다. 하지만 아무 때나 눈치 없이 말을 건다면 도움은커녕 하는 일에 방해만 될 수 있다.

연구팀은 스마트 스피커가 선제적으로 음성서비스를 제공하기 좋은 최적의 시점을 찾는 연구를 수행했다. 그 결과 최적의 발화(發話) 시점을 결정하는 중요한 사용자 상황맥락 요인을 찾았다.

최적의 발화 시점에 관한 추론은 인공지능 비서가 음성서비스를 시작하거나 중지 또는 재개를 스스로 결정하고 제어하기 위한 필수적인 기술이다. 연구팀이 찾아낸 중요한 상황맥락 요인은 최적의 발화 시점 추론 시 정확성을 높일 것으로 관계자들은 기대하고 있다.

연구팀은 먼저 실험용 스마트 스피커를 제작했다. 스마트 스피커는 사용자의 움직임이 감지되거나 일정한 시간이 지나면 주기적으로 “지금 대화하기 좋은가요”라는 질문을 했다. 참가자는 대화하기 좋은지 아닌지, “네” 또는 “아니요”로 대답하고 무엇을 하고 있었는지를 설명했다. 연구진은 이어 교내 기숙사에 거주하는 학생 40명의 방에 스마트 스피커를 설치해 1주일간 총 3,500개의 사용자 응답 데이터를 수집했다.

데이터 분석 결과 전체 참가자 응답 중 47%는 대화하기 부적절한 것으로 나왔다. 이에 연구진은 대화하기 좋은 시점을 결정하는 주요 상황 요인을 찾기 위해 19개의 실내 활동 범주를 만들어 테스트했다. 테스트 결과 연구팀은 적절한 시점을 결정하는 상황맥락 요인으로 크게 개인적 요인과 움직임 요인, 사회적 요인을 꼽았다.

개인적 요인은 크게 ‘활동 집중도’, ‘긴급함과 바쁨 정도’, ‘정신적·육체적 상태’, ‘다중 작업수행을 위한 듣기 또는 말하기 가능성’ 등 4가지다. 예를 들면 집중해서 공부하고 있거나 드라이로 머리를 말리고 있을 때는 스피커와 대화가 어려웠다. 움직임 요인은 외출, 귀가 그리고 활동 전환 등 3가지다. 특히 사용자 움직임이 있을 때는 스피커와 대화 가능한 거리가 최적 시점 판단에 큰 영향을 미쳤다. 외출은 스피커와 대화 가능 범위 밖으로 나가는 움직임이고, 귀가는 범위 안으로 들어오는 움직임이다. 범위 안으로 들어오는 귀가(歸家) 상황일 때는 대부분 대화하기 좋은 시점으로 분류됐다.
헤럴드경제

왼쪽부터 차나래 학생, 김아욱 강원대 교수, 이의철 KAIST 교수가 사용자의 최적 발화시점이 프로그래밍된 스마트 스피커를 들고 있다. [KAIST 제공]

<이미지를 클릭하시면 크게 보실 수 있습니다>


연구팀은 전화 대화뿐만 아니라 누군가와 함께 있다는 것 또한 스마트 스피커와 대화하기 좋은 시점에 영향을 끼친다는 현상을 확인했다. 룸메이트가 자고 있거나 어떤 활동에 집중하고 있을 때 스마트 스피커와의 대화로 인한 갈등을 최소화하고 싶기 때문이다.

이의진 교수는 “센서 데이터로 감지된 상황맥락 정보를 활용해 스마트 스피커가 스스로 대화를 시작·중지, 또는 재개하기 좋은 타이밍을 선제적으로 감지하는 프로그래밍을 진행할 계획”이라고 말했다.

이번 연구성과는 유비쿼터스 컴퓨팅 분야 국제학술지 ‘프로시딩 오브 더 ACM 온 인터렉티브, 모바일, 웨어러블 앤 유비쿼터스 테크놀로지’ 9월호에 게재됐다.

nbgkoo@heraldcorp.com

- Copyrights ⓒ 헤럴드경제 & heraldbiz.com, 무단 전재 및 재배포 금지 -
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.