컨텐츠 바로가기

02.23 (일)

기술 도용·보안 문제…도마 오른 딥시크 ‘R1’

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
챗GPT 개발사 ‘의혹의 시선’
데이터 무단 수집 여부 조사

미 해군, R1 사용 금지시켜

중국 스타트업 딥시크의 추론형 모델 ‘R1’이 인공지능(AI) 업계에 파장을 일으키는 가운데, 이에 대한 우려도 제기된다. 오픈AI의 모델을 도용했다는 의심과 함께 보안 취약성을 지적하는 목소리가 커지고 있다.

29일(현지시간) 블룸버그통신 등에 따르면 챗GPT 개발사 오픈AI와 마이크로소프트(MS)는 딥시크가 AI 모델 훈련을 위해 오픈AI 데이터를 무단으로 수집했는지 여부에 대한 조사에 착수했다.

오픈AI는 딥시크가 ‘증류(distillation)’ 기술을 썼는지 의심하고 있다. 이는 대형 AI 모델에서 얻어낸 데이터를 활용해 작은 AI 모델을 훈련시키는 프로그래밍 방식을 뜻한다. 자연 상태의 화학물질을 증류해 불순물을 걸러내고 고순도의 물질을 뽑아내듯, 성능이 우수한 모델이 정제해준 지식을 더 작은 모델로 이전해 높은 성능과 정확도를 내도록 해준다.

지금까지 세계 각지의 AI 연구소 및 스타트업들은 개발 비용을 아끼기 위해 오픈AI 챗GPT 등을 활용한 증류 기법을 써왔다. 오픈AI는 서비스 약관에 “우리의 서비스를 복사하거나, 경쟁 모델을 개발하기 위해 사용할 수 없다”고 명시하고 있으나 암묵적으로 이를 허용해왔다. 그러나 딥시크가 챗GPT를 압도한다는 평가가 나오자 무단 사용 여부 조사에 나선 것으로 보인다.

보안 경고도 나오고 있다. 미국 해군은 지난 24일 내부 구성원들에게 e메일을 보내 “딥시크의 AI를 어떤 형태로든 사용하지 말라”고 지시했다. 미 해군은 “모델의 출처, 사용과 관련된 보안·윤리적 우려 때문”이라고 밝혔다.

국내에서도 하정우 네이버 클라우드 AI 이노베이션센터장이 딥시크 R1을 두고 “수집하는 정보가 매우 광범위하다”고 우려했다. 하 센터장은 페이스북을 통해 “사용장비 정보는 물론 키보드 입력 패턴이나 리듬, IP 정보, 장치 ID 등은 기본에 쿠키까지 깡그리 (수집한다)”고 했다. 중국 인터넷 규제 기관의 검열 의혹도 나온다. 예를 들어 R1은 ‘톈안먼(천안문) 사건’이나 대만의 주권과 같은 주제에 대해서는 답변하지 않는다. 시진핑 정권과 관련된 논란의 여지가 있는 주제에 대한 답변도 거부하도록 설계됐다.

김상범 기자 ksb1231@kyunghyang.com

▶ 매일 라이브 경향티비, 재밌고 효과빠른 시사 소화제!
▶ 계엄, 시작과 끝은? 윤석열 ‘내란 사건’ 일지 완벽 정리

©경향신문(www.khan.co.kr), 무단전재 및 재배포 금지

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.