개인정보위, 오픈AI 등에 “주민번호 등 주요 정보 사전 제거 개선하라”

매일경제 원문
정호준 기자(jeong.hojun@mk.co.kr)
입력

2024.03.28 15:12

주소복사가 완료되었습니다

오픈AI·구글·MS·메타·네이버·뤼튼 등 사업자 대상

고학수 개인정보보호위원회 위원장이 27일 오후 서울 종로구 정부서울청사에서 개최된 2024년 제6회 개인정보보호위원회 전체회의에서 모두말씀을 하고 모습 [사진 = 개인정보보호위원회]

<이미지를 클릭하시면 크게 보실 수 있습니다>

개인정보위원회가 오픈AI 등 6개의 인공지능(AI) 기업에 대해 주민등록번호와 같은 주요 식별정보 처리 조치 등에 있어 개선을 권고했다.

개인정보보호위원회는 27일 제6회 전체 회의를 열고, 대규모언어모델(LLM)을 개발하고 배포하거나 LLM을 기반으로 AI 서비스를 제공하는 6개 사업자에 대해 개인정보 보호 취약점을 보완하도록 개선 권고를 의결했다.

6개 사업자에는 오픈AI, 구글, 마이크로소프트(MS), 메타, 네이버, 뤼튼 등이 포함됐다.

개인정보위에 따르면 사업자가 AI 모델 학습을 위해 인터넷에 공개된 데이터를 수집하고 사용하는 과정에서 주민등록번호, 신용카드번호 등 중요한 개인정보가 포함될 수 있는 것으로 나타났다.

사전 실태점검 결과 오픈AI와 구글, 메타는 개인정보 집적 사이트를 AI 모델 학습에서 배제하고, 학습데이터 내 유해 콘텐츠 제거와 AI 모델이 개인정보를 답변하지 않도록 하는 조치는 적용하고 있었다.

다만 학습데이터에서 주민등록번호와 같은 주요 식별정보를 사전 제거하는 조치가 충분하지 않았다고 개인정보위는 설명했다.

지난해 기준 2만999개 인터넷 페이지에서 주민번호, 여권번호와 같은 개인정보 노출이 탐지되고 있는 상황이다.

이에 대해 개인정보위는 사전 학습 단계에서 주요 개인식별정보가 제거될 수 있도록 단계별 보호조치 강화를 요구했다. 한편 개인정보위는 국민의 개인정보가 노출된 것을 탐지한 데이터를 AI 서비스 사업자에 제공할 계획이다.

또한 개인정보위는 AI 서비스 사업자들이 이용자가 입력한 데이터에 대한 인적 검토를 진행할 경우 이를 이용자에게 명확하게 고지하도록 모든 사업자에 권고했다.

현재 사업자들은 AI 모델이 정확한 답변을 하도록 검토 인력을 투입해 AI 모델의 답변 내용을 직접 열람하고 검토해 수정하는 방법으로 데이터를 서비스 개선에 활용하고 있는 것으로 나타났다.

다만 이용자 관점에서는 본인이 입력한 데이터가 이러한 인적 검토 과정을 거치는지 알기 어렵고, 민감한 내용을 입력했을 시 해당 내용이 데이터베이스에 저장되어 사생활 침해로 이어질 가능성이 있다.

개인정보위는 이처럼 이용자 입력 데이터에 대해 인적 검토과정을 거치는 경우 이용자에게 관련 사실을 고지하도록 하고, 이용자가 입력 데이터를 쉽게 제거할 수 있도록 접근성을 강화할 것을 권고했다.

LLM이 복제 모델이나 오픈 소스 형태로 배포되는 경우 LLM에 취약점이 발견돼도 후속 조치가 즉시 이뤄지기 어려운 사례도 확인됐다.

또한 동일 LLM 기반의 AI 서비스라도 사업자에 따라 개인정보나 아동·민감정보에 대한 답변 등 침해 예방 조치의 정도도 달랐다.

개인정보위는 AI 서비스와 관련된 내용을 종합해 개인정보 처리방침 등에 더 구체적으로 안내하고, 부적절한 답변에 대한 신고 기능을 반드시 포함하라고 권고했다.

개인정보위는 AI 응용 서비스 관련 5개 내외의 사업자에 대한 실태점검 결과도 추후 발표할 예정이다.

개인정보위는 “AI 관련 6대 가이드라인 등의 정책방향 마련, 개인정보 강화 기술(PET) 개발·보급 등의 후속 조치도 차질없이 추진할 계획”이라고 말했다.

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

11.26 (화)

개인정보위, 오픈AI 등에 “주민번호 등 주요 정보 사전 제거 개선하라”

매일경제 주요 뉴스