컨텐츠 바로가기

11.28 (목)

이슈 인공지능 시대가 열린다

GIST, 국제 AI 음향 인식 대회 1위…연구성과 주목

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

김홍국 교수 연구팀, ‘언어질의 기반 오디오 소스 분리부문’ 1위

‘실내 음향 이벤트 탐지 부문’ 3위

뉴시스

[광주=뉴시스]김홍국 GIST 전기전자컴퓨터공학부 교수(왼쪽)와 이도현 ·송윤아 학생.

<이미지를 클릭하시면 크게 보실 수 있습니다>


[광주=뉴시스] 배상현 기자 = 광주과학기술원(GIST)이 인공지능(AI) 기반 음성 신호처리 분야에서 탁월한 연구 성과로 주목받고 있다.

GIST는 지능을 연구하는 전기전자컴퓨터공학부 김홍국 교수 연구팀이 국제 음향 장면 및 이벤트 탐지 분류 경진대회에서 ‘언어질의 기반 오디오 소스 분리부문’ 1위와 ‘실내 음향 이벤트 탐지 부문’ 3위의 성과를 거뒀다고 9일 밝혔다.

이 대회는 국제전기전자공학회(IEEE) 산하 신호처리소사이어티(AASP)가 2013년부터 개최하는 세계적인 대회로, AI를 이용해 소리를 듣고 상황을 판단하는 음향 인식 기술을 겨룬다. 올해는 4월1일부터 6월15일까지 약 3개월간 108개의 유수 기관 및 대학이 참가해 음향 장면 인식, 기계 이상 진단 확인 등 10개 분야에서 경쟁을 펼쳤다.

오디오지능연구실 학생들로 구성된 ‘GIST-AunionAI’ 팀(석박통합과정 송윤아·석박통합과정 이도현 학생, 김홍국 교수)은 김홍국 교수의 창업 회사인 오니온에이아이(AunionAI)의 지원을 받아 ‘DCASE 챌린지 2024’의 ‘언어질의 기반 오디오 소스 분리 과제(Language-Queried Audio Source Separation, Task 9)’ 부문에서 1위를 달성하며 연구 성과의 우수성을 입증했다.

한화비전 연구원과 함께 구성된 GIST-HanwhaVision 팀(GIST 석사과정 손상원 학생, 석박통합과정 박종연 학생, 김홍국 교수, HanwhaVision: 노승인 상무, 임정은 수석연구원, Sulaiman Vesal)은 음향 이벤트 탐지 과제(DCASE Task 4)’에서 3위를 차지했다.

‘언어질의 기반 오디오 소스 분리(LASS) 기술’은 사용자가 입력한 텍스트에 따라 이에 맞는 오디오 신호를 분리하는 기술이다. 텍스트 질의를 통해 오디오 소스를 분리 생성함으로써 언어와 오디오를 연결하는 생성형 AI 모델 개발의 기초를 제공하며 자동 오디오 편집, 멀티미디어 콘텐츠 검색, 증강 청취 등 다양한 응용 분야에서 활용될 수 있다.

김홍국 교수는 “GIST 연구실과 ㈜오니온에이아이, 한화비전이 협업하여 얻은 성과로서 개발된 AI 모델이 연구실에 머물지 않고 사업화로 나아갈 수 있다는 가능성에 그 의의가 매우 크다”며 “특히 LLM 기반 오디오 생성 및 인식 AI 모델을 지속적으로 개선하는 노력과 함께 이를 다양한 분야에 적용하여 편리하고 안전한 삶을 위한 기술 발전에 기여하겠다”고 말했다.

☞공감언론 뉴시스 praxis@newsis.com

▶ 네이버에서 뉴시스 구독하기
▶ K-Artprice, 유명 미술작품 가격 공개

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.