(왼쪽부터) 딥시크, 챗GPT 애플리케이션(앱)./연합뉴스 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
중국 인공지능(AI) 딥시크(DeepSeek) R1에게 ‘불수능’으로 평가받는 2024년도 수능 국어영역 공통과목을 풀어보라고 주문했습니다. 놀랍게도 34문제 가운데 5문제만 틀려 총 12점이 감점됐습니다. 수학 과목 역시 고난도 문제 몇 개를 빼고는 척척 풀어나갔습니다.
이뿐만 아니라 R1은 미국 수학 경시대회에서 79.8%의 정확도로 미국 오픈AI 챗GPT의 o1(79.2%)을 앞섰다고 합니다. 코딩 테스트에서도 65.9%의 정확도로 o1(63.4%)을 눌렀습니다. IT 매체 테크크런치는 R1이 다양한 수학, 코드 및 추론 작업에서 o1과 비슷하거나 능가한다는 평가를 얻고 있다고 했습니다.
◇ 싸기만 한 줄 알았는데 더 똑똑하네… 美 빅테크도 견제
저렴한 R1이 o1보다 낫다면 고객으로서는 굳이 비싼 돈을 들여 챗GPT를 구독할 필요가 없겠죠. 또 막대한 개발 비용이 가장 큰 진입장벽이었던 만큼, AI 후발주자들이 앞다퉈 시장에 뛰어들 가능성도 커졌습니다. 이날 국내 AI 소프트웨어 업종으로 분류되는 네이버와 카카오 주가는 각각 직전 거래일 대비 6.13% 상승한 21만6500원, 7.27% 오른 3만8350원으로 마감했습니다.
31일 오전 딥시크에 서울 성동구 왕십리역에서 서울 중구 광화문 코리아나호텔로 가는 교통편을 물어보니 환각 증상이 나타나고 있다./딥시크 캡처 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
◇ 딥시크도 ‘환각’ 현상은 극복 못해
그러나 딥시크 열풍이 계속될지는 지켜봐야 할 것 같습니다. 딥시크 R1 역시 AI 모델이 겪는 ‘환각(할루시네이션)’ 증상이 나타납니다. AI 환각 증상이란, 대화형 모델이 맥락에 맞지 않는 엉뚱한 답변을 마치 진실인 것처럼 이야기하는 증상을 의미합니다. 환각 증상은 주로 데이터 품질이 낮거나 정보를 선별하는 알고리즘이 빈약해 발생합니다.
또 중국 IT 기업으로서는 피할 수 없는 정보 유출 논란도 화두에 올랐습니다. 미국과 유럽 등 전 세계 정부와 기업들은 정보 유출을 우려해 구성원들에게 ‘딥시크를 깔지 말아달라’며 사용을 막고 있습니다.
딥시크의 개발 비용을 어디까지 믿을 수 있을 지도 문제입니다. 딥시크는 기존 업체들이 쓰는 ‘지도 학습(Supervised Fine-Tuning)’ 대신 ‘강화 학습(Reinforcement Learning)’에 집중한 것으로 알려졌습니다. 강화 학습은 AI가 스스로 답을 찾도록 추론 능력을 높이는 기술입니다. 즉, 비용을 들여 특정 분야에 대해 학습을 시켜야 하는 ‘지도학습’ 모델보다 저렴하게 성능을 높일 수 있다는 것입니다.
딥시크는 총 학습 비용은 공개했지만, 개발 과정에 대한 명확한 설명은 피하고 있습니다. 이 때문에 ‘오픈AI’의 학습 데이터를 불법으로 가져왔다는 의혹도 받습니다. 이 의혹이 사실이라면 딥시크의 장점인 ‘가성비’는 퇴색될 것 같습니다. 개발 비용에 학습 데이터 이용 비용도 더해져야 하기 때문입니다.
주 교수는 또한 “개발 비용이 약 80억원이 들었다는 점은 중국이나 딥시크에서 과장했을 가능성을 배제할 수 없다”라며 “개발 마지막 단계에서 들어간 금액이 80억원이라는 것이지, 시행착오에 투입된 비용까지 포함하면 그보다 더 큰 비용이 들어갔을 것”이라고 진단했습니다.
윤예원 기자(yewona@chosunbiz.com)
<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.