다양한 데이터 분포서 높은 성능…"IT·의료 분야서 역할"
UNIST 윤성환 교수팀 |
(울산=연합뉴스) 김용태 기자 = 울산과학기술원(UNIST)은 사용자의 개인정보를 보호하면서도 인공지능(AI) 성능을 높일 수 있는 기술을 개발했다고 1일 밝혔다.
UNIST에 따르면 인공지능대학원 윤성환 교수팀은 '연합학습'(Federated Learning)을 활용한 'FedGF'(Federated Learning for Global Flatness) 기술을 만들었다.
딥러닝 모델을 학습하기 위해서는 데이터를 중앙 서버에 모으는데, 이 과정에서 사용자가 가진 데이터를 활용하게 된다.
이때 사용자의 개인정보를 침해할 우려가 있다
이를 해결하기 위해 등장한 연합학습 기술은 사용자가 가진 데이터를 중앙 서버로 보내는 것이 아니라 사용자 본인의 데이터를 활용해 딥러닝 모델을 학습하고, 학습된 모델을 중앙 서버에 보내는 것이다.
이때 중앙 서버는 각 사용자의 데이터를 확인할 수 없기 때문에 개인정보가 보호될 수 있다.
그러나 실제 환경에서는 각 사용자의 데이터 이질성으로 딥러닝 모델 성능에 악영향을 주고 있다.
이에 연구팀은 연합학습에서 사용자가 학습하는 로컬 모델뿐만 아니라 글로벌 모델의 일반화 성능을 높일 수 있는 방법을 개발했다.
다양한 사용자 데이터 분포 상황에서도 일관되게 높은 성능을 낼 수 있도록 한 것이다.
일반화 성능은 딥러닝 모델을 학습시킨 데이터 분포가 변했을 때 모델의 성능이 얼마나 차이 나는지 확인할 수 있는 지표다.
연구팀은 FedGF가 기존 방법보다 적은 통신 자원으로도 완전한 학습이 가능해 와이파이와 같은 무선 통신을 사용하는 모바일 장치에 특히 유리하다고 설명했다.
윤성환 교수는 "연합학습 기술은 AI로 인한 개인정보 침해 문제 해결의 핵심적인 발판이 될 것"이라고 말했다.
제1저자 이태환 연구원은 "기업은 FedGF 기술로 개인정보 침해 없이 높은 성능의 AI 모델을 얻을 수 있다"며 "IT, 의료, 자율주행 등 다양한 분야에서 주요 역할을 할 것"이라고 덧붙였다.
연구 결과는 국제 학술대회 'ICML'(International Conference on Machine Learning)에 7월 20일 온라인으로 게재됐다.
연구는 과학기술정보통신부 지원 정보보호 국제공동연구 및 정보통신방송혁신인재양성사업을 통해 이뤄졌다.
yongtae@yna.co.kr
▶제보는 카카오톡 okjebo
▶연합뉴스 앱 지금 바로 다운받기~
▶네이버 연합뉴스 채널 구독하기
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.