인공지능(AI) 경쟁에서 뒤처지고 있다는 평가를 받는 애플이 AI 성능을 개선하기 위해 아이폰 등 고객들이 사용 중인 기기 속 데이터를 분석하는 새로운 훈련 방식을 도입한다. 그동안 개인정보 활용을 철저히 차단한 채 합성 데이터만으로 AI를 학습시켜온 방침을 수정한 것이다. 이용자의 실제 데이터를 분석 대상으로 삼는 만큼 개인정보 침해 논란을 피하기 어려울 전망이다.
15일(현지시간) 블룸버그의 애플 전문기자 마크 거먼 보도에 따르면 애플은 최근 '차등 개인정보 보호를 활용한 애플 인텔리전스 집계 추세 이해'라는 제목의 기술문서를 공개하고 사용자 데이터와 합성 데이터를 결합해 애플 인텔리전스의 기반이 되는 모델을 훈련시킨다는 계획을 밝혔다.
지금까지 애플은 합성 데이터만으로 AI를 학습시켜왔다. 이는 개인정보 노출 가능성이 없지만 실제 고객의 사용 패턴을 정확히 반영하지 못해 트렌드 파악이나 자연스러운 맥락 이해에 한계를 드러냈다.
15일(현지시간) 블룸버그의 애플 전문기자 마크 거먼 보도에 따르면 애플은 최근 '차등 개인정보 보호를 활용한 애플 인텔리전스 집계 추세 이해'라는 제목의 기술문서를 공개하고 사용자 데이터와 합성 데이터를 결합해 애플 인텔리전스의 기반이 되는 모델을 훈련시킨다는 계획을 밝혔다.
지금까지 애플은 합성 데이터만으로 AI를 학습시켜왔다. 이는 개인정보 노출 가능성이 없지만 실제 고객의 사용 패턴을 정확히 반영하지 못해 트렌드 파악이나 자연스러운 맥락 이해에 한계를 드러냈다.
애플이 새롭게 도입하려는 방식은 실제 이용자 데이터에 기반한 합성 데이터를 생성하는 것이다. 아이폰·아이패드·맥 등 애플 기기의 이메일에서 수집된 실제 사용자 샘플을 기존 합성 데이터와 비교해 유사도를 평가한다. 이를 통해 사람들이 자주 사용하는 표현이나 메시지 패턴을 정확히 파악해 AI가 현실을 더욱 잘 반영하는 결과를 도출할 수 있도록 하겠다는 게 애플의 목표다.
애플은 수집하는 모든 데이터에 의도적인 노이즈를 추가해 사용자 식별이 불가능하도록 만드는 '차등 개인정보 보호' 기술이 적용된다고 밝히면서 개인정보 침해 논란을 일축했다.
또한 수집된 데이터는 기기 외부로 유출되지 않으며 사용자 동의 없이는 작동하지 않아 안전하다고 강조했다. 아이폰·아이패드·맥북 등을 초기 설정할 때 애플의 데이터 분석 기능에 동의하지 않으면 AI 훈련 시스템이 활성화되지 않는다는 설명이다.
최근 애플 인텔리전스를 기반으로 한 AI 비서 '시리(Siri)'의 핵심 기능 출시가 지연되는 등 애플은 이미 업계에서 'AI 지각생'이라는 낙인이 찍힌 상태다. 최근에는 시리 관련 사업부서의 경영진을 대거 교체했다.
[안선제 기자]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
