KAIST 황의종 교수 연구팀
학습 데이터 선택 기술 개발
황의종(왼쪽) 교수와 황성현 박사과정생 |
실생활에 활용되는 인공지능(AI) 모델이 시간이 지남에 따라 성능이 점차 떨어지는 현상이 다수 발견, 지속가능한 인공지능 학습 기술에 대한 필요성이 커지고 있다. 인공지능 모델이 꾸준히 정확한 판단을 내리는 것은 더욱 안전하고 신뢰할 수 있는 인공지능을 만들기 위한 중요한 요소다.
KAIST는 황의종 전기및전자공학부 교수 연구팀이 시간에 따라 데이터의 분포가 변화하는 드리프트 환경에서도 인공지능이 정확한 판단을 내리도록 돕는 새로운 학습 데이터 선택 기술을 개발했다고 14일 밝혔다.
최근 인공지능이 다양한 분야에서 인간의 능력을 뛰어넘을 정도의 높은 성능을 보여주고 있지만, 대부분의 좋은 결과는 인공지능 모델을 훈련시키고 성능을 테스트할 때 데이터의 분포가 변하지 않는 정적인 환경을 가정함으로써 얻어진다.
하지만 이러한 가정과는 다르게 SK하이닉스의 반도체 공정 과정에서 시간에 따른 장비의 노화와 주기적인 점검으로 인해 센서 데이터의 관측값이 지속적으로 변화하는 드리프트 현상이 관측되고 있다.
시간이 지나면서 데이터와 정답 레이블 간의 결정 경계 패턴이 변경되면, 과거에 학습됐던 AI 모델이 내린 판단이 현재 시점에서는 부정확하게 되면서 모델의 성능이 점차 악화될 수 있다.
연구팀은 이러한 문제를 해결하기 위해 데이터를 학습했을 때 인공지능 모델의 업데이트 정도와 방향을 나타내는 그래디언트(gradient)를 활용한 개념을 도입, 제시한 개념이 드리프트 상황에서 학습에 효과적인 데이터를 선택하는 데에 도움을 줄 수 있음을 이론적으로 실험적으로 분석했다. 이러한 분석을 바탕으로 데이터의 분포와 결정 경계가 변화해도 모델을 강건하게 학습할 수 있는 지속가능한 데이터 중심의 인공지능 학습 프레임워크를 제안했다.
이 학습 프레임워크의 주요 이점은 기존 변화하는 데이터에 맞춰서 모델을 적응시키는 모델 중심의 인공지능 기법과 달리 드리프트의 주요 원인이라고 볼 수 있는 데이터 자체를 직접 전처리를 통해 현재 학습에 최적화된 데이터로 바꿔주는 것이다.
이를 통해 기존의 인공지능 모델 종류에 상관없이 쉽게 확장될 수 있다는 점에 있다. 실제 이 기법을 통해 시간에 따라 데이터의 분포가 변화되었을 때에도 인공기능 모델의 성능, 즉 정확도를 안정적으로 유지할 수 있었다.
황 교수는 “인공지능이 변화하는 데이터에 대해서도 성능이 저하되지 않고 유지하는 데에 도움이 되기를 기대한다”고 말했다.
이번 연구 결과는 2월 캐나다 밴쿠버에서 열린 인공지능 최고 권위 국제 학술대회인 ‘국제 인공지능 학회’에서 발표됐다. 구본혁 기자
nbgkoo@heraldcorp.com
Copyright ⓒ 헤럴드경제 All Rights Reserved.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.