컨텐츠 바로가기

11.21 (목)

중국서 'o1'과 경쟁하는 추론 모델 '딥시크-R1' 출시

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박찬 기자]
AI타임스

<이미지를 클릭하시면 크게 보실 수 있습니다>


중국에서 오픈AI의 'o1' 모델과 경쟁한다는 새로운 추론형 인공지능(AI) 모델이 등장했다. 특히 오픈AI처럼 사용자 질문에 대한 응답 품질을 높이기 위해 추가적인 컴퓨팅 리소스와 시간을 활용하는 '테스트-타임 컴퓨트(Test-Time Compute)' 기술을 적용했다.

중국 AI 연구 기업인 딥시크는 20일 오픈AI의 'o1-프리뷰' 모델과 성능 면에서 비슷하다는 추론형 AI 모델 '딥시크-R1(DeepSeek-R1)'을 공개했다.

딥시크-R1은 작업을 계획하고 논리적으로 추론하며, 정답에 도달하기 위한 여러 단계를 수행한다. 질문이 복잡할수록 응답을 내기 전에 수십 초 동안 '생각'할 수 있으며, 이는 o1 모델과 유사하다.

o1에도 사용된 테스트-타임 컴퓨트 기술은 기존의 데이터 및 컴퓨팅 자원을 단순히 늘리는 방식으로는 한계에 부딪힌 '스케일링 법칙'의 대안으로 등장했다. 이 기술은 모델이 작업을 수행하는 동안 추가적인 처리 시간을 할애해 정확성과 신뢰성을 높이는 데 중점을 둔다.

AI타임스

<이미지를 클릭하시면 크게 보실 수 있습니다>


딥시크는 '딥시크-R1-라이트-프리뷰' 모델이 AI 벤치마크 테스트인 AIME와 MATH에서 오픈AI의 o1-프리뷰와 동등한 성능을 보였다고 주장했다. AIME는 AI 모델 간 성능 비교를 위한 평가 시스템이며, MATH는 수학적 문제 풀이를 평가하는 데이터셋이다.

그러나 X(트위터) 사용자들에 따르면 딥시크-R1는 보드 게임 '틱택토' 같은 간단한 논리 문제에서 약점을 보였으며, 일부 경우에는 안전장치를 무시한 답변을 내놓은 것으로 알려졌다.

특히 시진핑 중국 국가 주석이나 천안문 광장, 중국의 대만 침공과 같은 주제에 대해서는 답변을 거부했다. 중국 내에서 서비스되는 AI 모델은 정부의 인터넷 규제를 준수하고 사회주의 핵심 가치를 반영하는지 검열을 통과해야 한다.

딥시크는 향후 딥시크-R1를 오픈 소스로 공개하고 API도 제공할 계획이라고 밝혔다.

한편, 오픈AI o1이 등장한 뒤 중국 연구진이 추론 개발에 매달린 결과 관련 모델이 서서히 등장하고 있다.

며칠 전에는 알리바바와 베이징대학교, 칭화대학교 등 연구진이 협력해 최초의 추론 중심 시각언어모델(VLM)인 '라바-o1(LLaVA-o1)'을 선보였다. 이 모델은 '라마-3.2-비전-인스트럭트'를 기반으로 개발됐으며, 110억개의 매개변수를 통해 자율적이고 다단계적인 추론을 수행할 수 있도록 설계다.

라바-o1의 가장 큰 특징은 기존 VLM의 한계를 극복하기 위해 도입된 체계적인 추론 프로세스다. 모델은 요약(Summary), 캡션(Caption), 추론(Reasoning), 결론(Conclusion)의 네단계로 이뤄진 독창적인 추론 구조를 채택했다. 이를 통해 비주얼 데이터를 더 깊이 이해하고 분석하며, 이전 모델보다 정교하고 정확한 결과를 제공하는 데 중점을 두고 있다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.