"딥시크 모델, 새로 등장한 기술 아냐…AI 모델, 소형화·전문화할 것"
삼성 위탁생산 AI 가속기 칩, 맞춤형 연산에 집중…"효율성, 엔비디아 칩 능가"
미국 뉴욕주의 IBM 왓슨 연구소 |
(뉴욕=연합뉴스) 이지헌 특파원 = 인공지능(AI) 개발에서 개방형 전략을 펴고 있는 IBM의 연구진들은 30일(현지시간) AI 모델이 앞으로 개별 기업의 필요에 따라 맞춤형으로 소형화, 전문화하고 비용도 지속해서 낮아질 것이라고 내다봤다.
또 최근 세상을 깜짝 놀라게 만든 중국 스타트업 '딥시크'의 AI 모델은 이런 흐름에 부합하는 개방형 혁신의 결과물로, 갑자기 새로 등장한 기술이 아니라고 설명했다.
IBM 연구소의 닉 풀러 AI·자동화 부문 부사장은 이날 미국 뉴욕주 요크타운하이츠의 IBM 왓슨 연구소에서 연 외신기자단 초청 설명회에서 "목적에 맞는 AI 모델을 만드는 것은 IBM이 지속해서 추구해온 방향"이라며 이처럼 말했다.
오픈소스 커뮤니티 참여 주체들은 코딩에 활용할 수 있는 AI 모델을 누구나 활용할 수 있도록 공개하는 것을 원칙으로 한다.
풀러 부사장은 자사의 그래니트 모델 중 일명 '전문가 혼합'(mixture of experts) 모델인 '액셀러레이터(가속기) 모델' 개념을 소개하면서 "이는 최근 딥시크에 의해 널리 알려진 AI 모델의 아키텍처와 정확히 일치한다"라고 설명했다.
IBM의 가속기 모델은 수백억 개의 매개변수로 구성되는 대형 모델과 달리 매개변수를 4억개 또는 8억개 정도로 축약해 목적에 맞게 특화한 AI 모델을 말하는데, 딥시크가 내놓은 R1 모델은 결국 IBM이 앞서 적용해온 가속기 모델 기술과 동일하다고 풀러 부사장의 설명했다.
오픈AI가 챗GPT를 통해 폐쇄형 범용 모델을 추구해온 것과 달리 IBM은 오픈소스 커뮤니티와 협업하며 맞춤형 AI 모델 개발을 추구해왔는데, 딥시크의 모델이 주목받으면서 IBM의 AI 전략도 재조명받게 됐다는 의미로 풀이된다.
IBM의 AI 전략 소개하는 닉 풀러 부사장 |
아빈드 크리슈나 IBM 최고경영자(CEO)도 이날 열린 실적발표 설명회에서 딥시크 관련 질문에 "IBM은 기업들이 대규모 언어모델을 도입하는 데 있어 좀 더 작은 모델과 좀 더 합리적인 모델 훈련 시간이 핵심이 될 것이라고 지난 1년여간 강조해왔다"며 "이런 접근 방식을 통해 추론 비용을 최대 30배까지 절감할 수 있음을 확인했다"라고 답변했다.
IBM은 AI 부문 성과에 힘입어 '깜짝 실적'을 기록하며 이날 주가가 13% 급등했다.
그는 "에이전트는 결과가 도출되는 시점에서 이를 최적화하는 것"이라며 "이는 현 생성형 AI 기술이 진화하는 방향성을 보여주는 패러다임"이라고 소개했다.
AI가 오류를 스스로 감지해 올바른 방향으로 수정하는 과정을 반복하면서 최종적으로 성공적인 결과물을 얻을 수 있도록 하는 방향으로 진화할 것이란 설명이다.
이날 설명회에선 IBM이 차세대 서버 시스템인 Z메인프레임과 연계해 개발 중인 AI 가속기 칩(AIU·Artificial Intelligence Unit)에 대한 소개도 이어졌다.
IBM은 특정 임무에 전문화한 AI 가속기 칩이 기업의 필요에 맞춰 낮은 가격에 효과적으로 AI 작업을 처리하게 해줄 것이라고 기대하고 있다.
IBM 연구소의 숀 할러데이 담당자는 이날 설명회에서 IBM의 AI 가속기 칩 성능이 엔비디아의 고성능 AI 칩 성능을 능가하느냐는 질의에 "그렇다"라면서 "엔비디아의 범용 그래픽처리장치(GPU)는 특정 임무에 전문화된 AIU의 효율성에 도달할 수 없다"라고 자신했다.
AI 가속기 칩 설명하는 IBM 연구진 |
pan@yna.co.kr
▶제보는 카카오톡 okjebo
▶연합뉴스 앱 지금 바로 다운받기~
▶네이버 연합뉴스 채널 구독하기
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.