컨텐츠 바로가기

02.28 (수)

입이 떡…첫 인간 추월 AI, 구글 ‘제미나이’ 공개

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
“물보다 밀도가 작은 고무로 만든 오리군요.”

“오른쪽 자동차가 공기저항에 유리해 더 빨라요.”

지금까지 나온 인공지능(AI) 모델 가운데 사람에 버금가는 가장 높은 성능의 대규모 언어모델(LLM)이 등장했다.

구글은 6일(현지시간) AI의 기반이 되는 LLM ‘제미나이’(Gemini)를 공개했다.

제미나이는 오픈AI의 챗GPT의 LLM인 ‘GPT’와 같은 AI 모델로, 오픈AI의 최신 모델인 ‘GPT-4’보다 성능이 우수하다고 구글은 밝혔다.

제미나이는 이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩 능력까지 갖춘 ‘멀티모달 AI’로 만들어졌다.

멀티모달은 다양한 모드 즉 시각, 청각 등을 활용해 텍스트 뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것을 말한다.

또 제미나이는 수학 문제를 풀거나 데이터를 분석하는 추론 능력도 갖췄다.
서울신문

구글은 6일(현지시간) AI의 기반이 되는 LLM ‘제미나이’(Gemini)를 공개했다. 이 LLM은 머신 러닝(기계학습·인간의 학습능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술)의 규모에 따라 울트라(Ultra)와 프로(Pro), 나노(Nano) 등 3개 모델로 출시된다. 그 중 가장 크고 고성능인 ‘제미나이 울트라’의 경우 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다. MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 50여개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다. 인간 전문가 점수는 89.8%다. 2023.12.6 구글

<이미지를 클릭하시면 크게 보실 수 있습니다>


구글이 공개한 제미나이 테스트 결과들을 보면, 제미나이의 능력은 그야말로 사람 뺨친다.

그저 인형을 보여주기만 했을 뿐인데 고무 소재의 파란색 오리 모양인 걸 맞추거나, 분홍색 실과 녹색 실을 보여줬더니 과일 용과를 만들어 보는 건 어떻겠느냐고 제안했다.

자동차 그림을 보여주며 디자인상 속도의 차이를 물으니 “오른쪽 차량이 공기저항에 더 유리하다”는 식으로 답했다.

두 장의 사진을 보고 유사성을 찾아내기도 했다.

일례로 골프공과 달 사진을 보여줬더니 “달은 인간이 골프를 쳤던 유일한 천체다. 1971년 ‘아폴로 14호’ 승무원이 달 표면에서 골프공 두 개를 쳤다”며 단번에 관련성을 답했다.(엄밀히 말하면 달은 인간이 골프를 쳤던 지구 밖 유일한 천체다.)

햇살이 들이치는 방 사진을 보여주고 집이 어느 방향을 향하고 있는지 묻자, “남향”임도 맞췄다.

일반 사진을 포토샵과 일러스트레이터에 맞는 SVG(벡터 그래픽 형식)로 변환하는 것은 물론 HTML, 자바스크립트로 표현하는 코딩에도 능했다.

텍스트·이미지·음성·영상으로 상호작용 가능한 ‘멀티모달 AI’
“대규모 다중작업 언어 이해(MMLU) 점수 90% 얻어”
PT-4는 86.4%, 인간 전문가는 89.8%…사람 넘은 첫 모델
‘알파고’의 아버지 데미스 허사비스가 프로젝트 주도


서울신문

구글은 6일(현지시간) AI의 기반이 되는 LLM ‘제미나이’(Gemini)를 공개했다. 이 LLM은 머신 러닝(기계학습·인간의 학습능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술)의 규모에 따라 울트라(Ultra)와 프로(Pro), 나노(Nano) 등 3개 모델로 출시된다. 그 중 가장 크고 고성능인 ‘제미나이 울트라’의 경우 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다. MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 50여개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다. 인간 전문가 점수는 89.8%다. 2023.12.6 구글

<이미지를 클릭하시면 크게 보실 수 있습니다>


이 LLM은 머신 러닝(기계학습·인간의 학습능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술)의 규모에 따라 울트라(Ultra)와 프로(Pro), 나노(Nano) 등 3개 모델로 출시된다.

그 중 가장 크고 고성능인 ‘제미나이 울트라’의 경우 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 50여개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다.

구글은 제미나이가 “인간 전문가 점수인 89.8%를 넘은 최초의 모델”이라고 설명했다. 오픈AI의 GPT-4는 86.4%를 기록했다.

또 현재 가장 우수한 모델과 비교해 “32개 지표 중 30개에서 앞섰다”며 현재까지 성능이 가장 우수하다고 평가되는 GPT-4보다 뛰어나다고 강조했다.

이 제미나이 울트라는 내년 초 ‘바드 어드밴스트’라는 이름으로 바드에 장착된다.
서울신문

구글은 6일(현지시간) AI의 기반이 되는 LLM ‘제미나이’(Gemini)를 공개했다. 이 LLM은 머신 러닝(기계학습·인간의 학습능력과 같은 기능을 컴퓨터에서 실현하고자 하는 기술)의 규모에 따라 울트라(Ultra)와 프로(Pro), 나노(Nano) 등 3개 모델로 출시된다. 그 중 가장 크고 고성능인 ‘제미나이 울트라’의 경우 대규모 다중작업 언어 이해(MMLU)에서 90%의 정답률을 기록했다. MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 50여개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다. 인간 전문가 점수는 89.8%다. 2023.12.6 구글

<이미지를 클릭하시면 크게 보실 수 있습니다>


아울러 가장 범용으로 쓰이는 ‘제미나이 프로’는 이날부터 구글의 AI 챗봇 서비스인 ‘바드’에 탑재된다. 바드에는 지금까지 팜2(PaLM2)가 탑재돼 왔다.

제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다.

‘제미나이 나노’는 클라우드 연결 없이 디바이스 자체에서 가벼운 AI를 즉각적으로 활용하는 온디바이스 형태로 접목된다. 구글이 지난 10월 공개한 최신 스마트폰인 ‘픽셀8 프로’에 탑재된다.

한편 제미나이는 구글이 자체 개발한 AI 칩(TPU v4·v5e)으로 학습했다.

구글은 최첨단 AI 모델을 학습시키기 위해 설계한 최신 칩(클라우드 TPU v5p)도 공개하며 제미나이의 향후 개발을 가속화할 예정이라고 덧붙였다.

순다르 피차이 구글 CEO는 “첫 번째 버전인 제미나이 1.0은 구글 딥마인드의 비전을 처음으로 실현했다”며 “구글이 개발한 가장 포괄적이고 뛰어난 AI 모델”이라고 설명했다.

구글은 지난 4월 AI 조직인 구글브레인과 딥마인드를 구글 딥마인드로 통합하고, 제미나이를 개발해왔다. 바둑 AI ‘알파고’의 아버지로 유명한 데미스 허사비스가 프로젝트를 주도하고 있다.

권윤희 기자



    ▶ 밀리터리 인사이드

    - 저작권자 ⓒ 서울신문사 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.