컨텐츠로 건너뛰기
검색
연합뉴스 언론사 이미지

[건강포커스] AI가 음성메시지로 우울 진단?…"임상시험서 정확도 75~91%"

연합뉴스 이주영
원문보기

[건강포커스] AI가 음성메시지로 우울 진단?…"임상시험서 정확도 75~91%"

속보
'케데헌', 아카데미 애니메이션상 후보...'골든' 주제가상 후보 지명
브라질 연구팀 "저렴하고 실용적인 우울증 선별 도구로 개발 기대"
(서울=연합뉴스) 이주영 기자 = 대규모 언어모델(LLM) 기반의 의료용 인공지능(AI)이 녹음된 음성 메시지를 분석해 주요우울장애(MDD)를 75~91% 정확도로 식별할 수 있다는 임상시험 결과가 나왔다.

왓츠앱 음성메시지를 이용한 주요우울장애 진단 인공지능 개요연구팀은 왓츠앱 음성메시지를 전처리하고 음향 특징을 추출해 7개 LLM 모델을 훈련시킨 다음, 독립적인 테스트 세트를 이용해 각 모델의 주요우울장애 진단 정확도를 평가했다. [Otani et al., 2026, PLOS Mental Health 제공. 재판매 및 DB 금지]

왓츠앱 음성메시지를 이용한 주요우울장애 진단 인공지능 개요
연구팀은 왓츠앱 음성메시지를 전처리하고 음향 특징을 추출해 7개 LLM 모델을 훈련시킨 다음, 독립적인 테스트 세트를 이용해 각 모델의 주요우울장애 진단 정확도를 평가했다. [Otani et al., 2026, PLOS Mental Health 제공. 재판매 및 DB 금지]



브라질 산타 카사 지 상파울루 의과학대학 루카스 마르케스 교수팀은 22일 의학 저널 플로스 정신 건강(PLOS Mental Health)에서 7가지 LLM 모델을 주요우울장애 환자와 건강한 성인 180명의 왓츠앱(WhatsApp) 음성 메시지를 이용해 학습시키고, 주요우울장애를 진단하게 하는 임상시험에서 이런 결과를 얻었다고 밝혔다.

연구팀은 일부 의료용 LLM 모델은 주요우울장애 식별에서 여성은 91%, 남성은 78%의 정확도를 보였다며 이는 AI를 실제 환경에서 음성 메시지를 이용해 주요우울장애를 식별하는 데 활용할 수 있는 가능성을 보여준다고 말했다.

주요우울장애는 세계적으로 2억8천만명 이상에게 영향을 미치는 흔한 정신건강 질환으로, 일상생활은 물론 업무 생산성, 대인관계, 전반적인 삶의 질에 큰 영향을 미칠 수 있으며, 적절한 치료를 위해서는 조기 발견이 중요하다.

연구팀은 그러나 주요우울장애 진단에 활용할 수 있는 신뢰할 수 있는 생물학적 지표가 부족해 선별 검사가 어렵고 이는 과소 진단으로 이어진다고 지적했다.

이들은 이 연구에서 주요우울장애 환자 78명과 건강한 일반인 82명이 한 주를 어떻게 보냈는지 설명하는 내용과 1부터 10까지 세는 것을 녹음한 왓츠앱 음성메시지를 이용해 7가지 LLM 모델을 훈련하고, 주요우울장애를 선별하게 했다.


훈련용 데이터세트에는 MDD 환자 45명(여성 37명, 남성 8명)과 건강한 지원자 41명(여성 30명, 남성 11명)이 포함됐고, 학습 후 MDD를 선별하는 시험용 데이터세트에는 환자 33명(여성 17명, 남성 16명), 대조군 41명(여성 21명, 남성 20명)이 포함됐다. 모든 참가자는 브라질 포르투갈어를 모국어로 사용했다.

시험 결과 LLM은 우울 상태를 분류할 때, 남성보다 여성에서 더 높은 정확도를 보였으며, 특히 '한 주를 어떻게 보냈는지 설명하라'는 과제를 줬을 때 정확도 차이가 더 두드러졌다.

최고 성능 모델의 경우 '한 주 설명' 음성메시지를 이용할 경우 주요우울장애 진단 정확도가 여성은 91.9%에 달했고, 남성 참가자의 정확도는 75%였다.


반면에 '1부터 10까지 세기' 음성메시지를 이용한 진단에서는 여성이 82%, 남성이 78%로 나타났다.

연구팀은 여성과 남성의 주요우울장애 진단 정확도 차이는 학습 데이터세트에서 여성 참가자 수가 남성보다 훨씬 많았던 점과, 여성과 남성 간 말하기 패턴의 차이에서 기인한 것일 수 있다고 말했다.

이어 지속해서 개선하면 LLM 모델을 우울증뿐 아니라다른 임상·연구용으로 활용할 수 있는 저렴하고 실용적인 선별 도구로 개발할 수 있을 것이라고 덧붙였다.


마르케스 교수는 "이 연구는 AI가 사람들이 일상적으로 주고받는 왓츠앱 음성메시지에 포함된 미묘한 음향적 패턴을 분석해 놀라울 정도의 정확도로 우울 성향을 식별할 수 있음을 보여준다"고 말했다.

◆ 출처 : PLOS Mental Health, Victor H. O. Otani et al., 'ML-based detection of depressive profile through voice analysis in WhatsApp™ audio messages of Brazilian Portuguese Speakers', https://plos.io/4sInRpy

scitech@yna.co.kr

▶제보는 카카오톡 okjebo
▶연합뉴스 앱 지금 바로 다운받기~
▶네이버 연합뉴스 채널 구독하기
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>