中 정부 데이터 감시 우려…민감 주제는 '회피'
美·EU, 사용 제한·차단 조치…정부도 실태 점검
딥시크 홈페이지. [사진=딥시크 홈페이지] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
데이터 보안 취약…"中정부 감시 우려"
중국 딥시크에 대한 첫 번째 우려는 데이터 보안 문제다. 딥시크는 개인 정보 보호 약관에서 중국 내 서버에 데이터를 수집하고 저장한다고 명시하고 있다. 이와 관련한 분쟁은 중국 정부의 법률의 적용을 받는다. 딥시크에 대해 외신들은 일제히 보안 결함을 우려하고 있다.
더 큰 문제는 딥시크의 광범위한 데이터 수집 범위다. 퀸즐랜드공대 AI책임연구소의 스노스웰 선임연구원은 "딥시크는 계정 정보와 플랫폼 활동 기록뿐만 아니라 키보드 입력 패턴까지 수집한다"며 "이는 지문이나 얼굴 인식처럼 개인을 특정할 수 있는 생체인식 정보로, 특별한 목적이 없다면 수집하지 않는 민감정보"라고 설명했다.
민감 주제는 회피…"中정부 통제?"
딥시크가 중국 정부의 통제를 받는다는 지적도 제기되고 있다. CNN 보도에 따르면 딥시크는 천안문 사태나 홍콩 민주화 시위와 같은 민감한 주제에 대해서는 의도적으로 답변을 회피하거나 중국 정부의 공식 입장만을 반영하는 것으로 나타났다.
실제로 1989년 6월 4일 천안문 사태에 대해 질문하면 처음에는 군사 진압 등 일부 사실을 언급하다가 답변을 지우고 "이런 질문에 어떻게 답해야 할지 모르겠다"며 화제를 돌리는 것으로 확인됐다.
CNN과의 인터뷰에서 스노스웰 연구원은 "모든 AI 기업이 윤리적 가이드라인을 설정하지만, 중국에서 개발된 기술의 특성상 친중국적 데이터를 더 많이 수집하게 되고 정부의 가치관이 정책에 반영될 수밖에 없는 구조"라고 설명했다.
학습 결과 신뢰성도 의문…"83% 부정확"
딥시크의 성능이 공개된 이후 학습 결과 신뢰성이 떨어진다는 점도 주목해야 한다. 미국 정보신뢰성 분석기업 뉴스가드가 최근 발표한 감사 결과에 따르면, 딥시크의 이전 모델인 V3는 뉴스·정보 주제 관련 질문에서 83%의 부정확도를 보였다. 서구권 AI 모델들과 비교한 순위에서도 11개 중 공동 10위를 기록했다.
학습 데이터의 출처도 논란이다. 오픈AI는 딥시크가 자사의 데이터를 무단으로 수집했다는 의혹을 제기하며 조사에 착수했다. 딥시크는 "중국 관영매체와 국제 자료를 포함한 다양한 공개 텍스트를 사용했다"고 해명했지만, 구체적인 데이터 출처와 학습 방식은 공개하지 않고 있다.
이탈리아 데이터보호기관은 개인정보 처리의 불투명성을 이유로 자국 내 접근을 차단했으며, 아일랜드도 유럽 데이터보호법 준수 여부를 조사 중이다. 우리 정부도 개인정보보호위원회를 통해 딥시크의 데이터 처리 실태 조사에 나섰다.
/윤소진 기자(sojin@inews24.com)
[ⓒ 아이뉴스24 무단전재 및 재배포 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.