컨텐츠 바로가기

01.31 (금)

이슈 인공지능 시대가 열린다

“중국판 샘 올트먼”…中 딥시크 창업으로 AI 돌풍 일으킨 85년생 ‘량원펑’

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

엔비디아 저가 칩으로 오픈AI 위협 추론모델 등 개발

중국 명문 저장대 졸업 후 헤지펀드 수익으로 딥시크 설립

중국 총리 포럼에 참석한 량원펑 딥시크 창업자. [바이두 캡처]

<이미지를 클릭하시면 크게 보실 수 있습니다>



[헤럴드경제=정호원 기자] 중국 인공지능(AI) 스타트업 딥시크에 세간의 관심이 집중되고 있는 가운데, 딥시크 창업자인 량원펑의 이력도 주목받고 있다.

85년생 검퓨터 공학 전공 ‘량원펑’…헤지펀드 설립부터 딥시크 창업까지

딥시크 창업자이자 최고경영자인 량원펑과 딥시크의 기업로고. [딥시크 홈페이지]

<이미지를 클릭하시면 크게 보실 수 있습니다>



27일(현지시간) 미 일간 월스트리트저널(WSJ)과 매사추세츠공대(MIT)의 정보기술매체 테크놀로지 리뷰 등에 따르면 딥시크는 1985년생 량원펑이라는 인물이 2023년 5월 중국 항저우에서 설립한 회사다.

중국 광둥성 출신인 량원펑은 공학 분야에서 손꼽히는 명문대인 저장대에서 컴퓨터 공학을 전공한 것으로 알려졌다.

그는 대학을 졸업하고 몇 년 뒤인 2015년 대학 친구 2명과 함께 ‘하이-플라이어’(High-Flyer)라는 헤지펀드를 설립하고 컴퓨터 트레이딩에 딥러닝 기법을 선구적으로 적용해 자금을 끌어모았다. 당시 하이-플라이어는 2019년부터 AI 개발을 위한 칩을 비축하기 시작했고, 거대언어모델(LLM)을 훈련할 수 있는 엔비디아의 그래픽처리장치(GPU) 약 1만개를 확보해 AI 칩 클러스터를 구축했다.

량원펑의 하이-플라이어 펀드의 자산은 80억달러(약 11조5000억 원) 수준으로 불어났고, 량원펑은 소규모 AI 연구소를 만들어 운영하다 독립적인 회사로 분리해 2023년 5월 딥시크를 창업했다.

딥시크는 2023년 11월 첫 번째 오픈소스 AI 모델 ‘딥시크 코더’를 공개한 데 이어, 지난해 5월에는 ‘딥시크-V2’를 출시했다. 이 모델은 강력한 성능과 저렴한 비용으로 크게 주목받으며 중국 내 AI 모델 시장에 가격 전쟁을 촉발했다. 이어 딥시크-V3과 딥시크-R1를 차레로 공개하며 딥시크를 세계에 알렸다.

CNN 방송은 그를 챗GPT 개발사인 오픈AI의 창업자이자 최고경영자(CEO) 샘 올트먼에 빗대 “AI 기술 전도사로 중국의 샘 올트먼이 됐다”고 표현했다.

WSJ은 “량원펑은 스스로 펀드 트레이더보다는 엔지니어로 인식되는 것을 선호한다”고 그와 가까운 사람들의 말을 인용해 전했다. 또 지난 20일엔 “량원펑이 리창 중국 총리와 만나 중국 기업들이 미국 기업들과의 기술 격차를 줄일 수 있는 방안에 대해 논의했다”면서 “량원펑은 중국 기업이 미국을 따라잡으려 부단히 노력하고 있지만 미국의 첨단 칩 수출 제한이 여전히 걸림돌이 되고 있다고 말했다”고 전했다.

경제매체 포브스는 딥시크 연구팀에는 중국 최고의 대학을 졸업한 젊은 인재들이 모여 있으며, 특히 전통적인 업무 경험보다 기술적인 능력을 우선하는 채용을 통해 “AI 개발에 대한 신선한 시각을 가진 고도로 숙련된 팀을 구성했다”고 했다.

딥시크의 경쟁력…더 나은 성능에 더 저렴한 비용

[로이터]

<이미지를 클릭하시면 크게 보실 수 있습니다>



딥시크는 V3와 R1이 모두 미국의 주요 AI 모델보다 성능이 더 낫거나 비슷한 수준이라고 평가했다. 특히 미국 수학경시대회인 AIME 2024 벤치마크 테스트에서 R1은 79.8%를 얻어 오픈AI ‘o1’의 79.2%보다 앞섰다고 딥시크는 밝혔다.

또 V3와 R1은 지난 25일 캘리포니아대 버클리(UC버클리) 연구원들이 챗봇 성능을 평가하는 플랫폼인 ‘챗봇 아레나’에서 상위 10위 안에 들기도 했다.

딥시크는 그간 미국 주요 기업들이 AI 모델 개발에 들인 비용보다 훨씬 적은 돈으로 자사의 모델을 개발해 주목을 받고 있기도 하다. 딥시크측은 V3 개발에 들인 비용이 557만6000달러(약78억8000만원)에 불과하다고 밝혔는데, 이는 메타가 최신 AI 모델인 라마(Llama) 3 모델을 엔비디아의 고가 칩 ‘H100’으로 훈련한 비용 대비 10분의 1 수준에 그친다.

다만 딥시크가 밝힌 금액은 엔비디아의 저렴한 칩인 ‘H800 GPU’를 시간당 2달러에 2개월 동안 빌린 비용을 계산한 것으로, 인건비와 운영비 등은 포함되지 않은 금액이어서 전체 비용이라고 할 수는 없다.

딥시크의 최신 추론 모델 R1은 기존 모델의 미세 조정(fine-tuning) 단계를 건너뛰고 강화 학습(reinforcement learning)에 초점을 맞춘 창의적인 설계 등으로 주목받았다. 오픈AI의 전 임원이었던 잭 카스는 딥시크의 이런 사례가 “자원 제약이 종종 창의성을 촉진한다는 큰 교훈을 보여준다”고 말했다.

하지만 중국 정부나 시진핑 국가주석에 대한 민감한 정치적 질문에는 답변을 피하는 등 정부의 검열을 받고 있다는 점은 딥시크 챗봇의 단점으로 꼽힌다.


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.