컨텐츠 바로가기

11.01 (금)

[FreeView] 톰과 제리? 오픈AI와 구글의 요절복통 추격전

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[남도영 기자]

테크M

<이미지를 클릭하시면 크게 보실 수 있습니다>



톰과 제리 기억하시나요? 얄미울 만큼 영리하게 도망치는 생쥐 '제리'와 막무가내로 뒤쫓다 늘 당하기만 하는 고양이 '톰'의 추격전은 언제 봐도 참 재밌었습니다. 여기 현실판 톰과 제리가 있네요. 바로 오픈AI와 구글입니다.

얄밉게 선수 친 오픈AI

지난 13일(현지시간) 오픈AI는 유튜브 스트리밍을 통해 '봄 업데이트' 행사를 열었습니다. 본사에 몇 명 앉혀두고 진행한 소박한 행사였지만, 파급력은 어마어마했습니다. 이날 오픈AI는 새 플래그십 생성형 AI 모델 ' 'GPT-4o'를 공개했습니다. 'GPT-5'도 아니고 고작 기존 'GPT-4' 업그레이드인데, 완전 다르게 보였습니다. 뇌만 있던 AI에 눈과 귀와 입을 달아줬기 때문입니다.

테크M

<이미지를 클릭하시면 크게 보실 수 있습니다>


'GPT-4o'를 탑재한 챗GPT는 사람의 말에 즉각적으로 반응하고, 농담도 하고, 노래도 하고, 심지어 대화 상대방의 감정까지 읽어냈습니다. 눈에 보이는 수학 문제를 풀이해주거나, 코드를 분석해주는 일도 척척 해냈습니다. 무엇보다 이런 일들을 정말 사람처럼 상호작용하며 해냈다는 게 놀라웠습니다. 이제 챗GPT를 '챗봇'이라 부르기엔 너무 부족한 표현 같습니다. 사람들은 영화 'Her'의 사만다가 현실에 나타났다며 환호했습니다.

하필 GPT-4o가 발표된 날은 구글이 4000명 이상이 참석하는 연례 최대 콘퍼런스 'I/O 2024'를 준비한 바로 전날이었습니다. 아주 노골적인 견제죠. 그야말로 잔칫날에 재를 뿌린 것입니다.

구글이 믿을 건 역시 '검색'

이번에도 얄미운 오픈AI한테 한방 먹은 구글은 14일(현지시간) I/O 행사에서 담담히 준비한 AI 보따리를 풀어놨습니다. 순다르 피차이 구글 최고경영자(CEO)는 이날 기조연설에서 'AI'란 단어를 120번 넘게 말했습니다. 이 숫자도 AI가 카운트해줬죠. 그야말로 'AI 잔치'였습니다. 오픈AI가 김을 빼놓지만 않았으면, 정말 대단한 축제였을 것입니다.

테크M

<이미지를 클릭하시면 크게 보실 수 있습니다>


구글은 자사의 기둥인 검색에 본격적으로 AI를 융합한다고 발표했습니다. 이제 AI가 검색 내용을 요약하고 더 자세히 알아볼 수 있는 링크를 제공하는 'AI 오버뷰'가 정식 서비스 됩니다. 단어가 아닌 긴 문장을 검색어로 넣어도 AI가 다단계 추론 기능을 활용해 여러 검색 결과를 모아서 정리된 페이지를 보여줍니다. 그동안 생성형 AI가 구글 검색 광고를 위협할 수 있다는 우려가 많았지만, 구글은 당당히 AI 검색이 트래픽을 더 끌어올리고, 광고도 더 많이 클릭하게 만들 수 있을 것이라고 자신했습니다.

이제 단순한 키워드 검색을 넘어 AI와 같이 식단이나 여행에 대한 계획을 세우거나, 관심있는 음식 레시피나 영화, 음악, 책, 호텔 등에 대해 AI가 정리한 내용들을 맞춤형으로 편집하며 브레인스토밍을 하는 일도 가능해졌습니다. 검색이야말로 누구도 구글을 넘을 수 없는 핵심 경쟁력입니다. 제 아무리 똑똑한 AI 모델도 구글만큼 인터넷에서 풍성한 정보를 끌어오진 못할 것입니다.

AI 최신 트렌드는 '멀티모달'과 'AI 비서'

구글은 검색 외에도 정말로 많은 AI 기술과 서비스를 선보였습니다. 핵심은 '멀티모달'과 'AI 어시스턴트'로 정리할 수 있겠습니다.

구글 제미나이는 동영상, 이미지, 오디오 등을 인식하는 '멀티모달' 능력을 키운 점도 주목됩니다. 구글은 스마트폰 카메라로 고장난 턴테이블을 보여주며 수리 방법을 물어보자 제품명을 스스로 알아내 수리 방법과 제품 메뉴얼을 찾아내 보여주는 모습을 시연했습니다. 사진첩에서 "내 딸이 수영을 어떻게 배웠는지 보여줘"라고 말하면 관련 사진을 모아서 보여줍니다. '추억'도 검색이 가능해진 것입니다.

테크M

<이미지를 클릭하시면 크게 보실 수 있습니다>


이런 멀티모달 능력은 사용자와 상호작용하는 'AI 어시스턴트'로 연결됩니다. 얄미운 오픈AI 때문에 또 한 발 늦긴했지만, 구글 역시 이번 행사에서 인상적인 AI 비서들을 공개했습니다. AI 어시스턴트에 "신발을 환불하고 싶어"라고 하면 이메일에서 영수증과 주문 번호를 찾아 반품 양식을 작성하고, 반품 택배를 예약하고, 픽업 일정을 캘린더에 올리는 등의 작업을 알아서 수행한다고 합니다. AI 어시스턴트를 워크스페이스를 비롯한 자사의 광범위한 서비스와 연동한다는 얘기입니다.

구글은 음성으로 자연스럽게 대화할 수 있는 '제니나이 라이브'가 먼저 선 보일 예정이며, '알파고의 아버지' 데미스 하사비스가 주도하는 '프로젝트 아스트라'도 준비 중이라고 밝혔습니다. 프로젝트 아스트라는 질문에 즉각적으로 대답하고, 카메라로 보여주는 사물이나 코드를 설명할 줄 압니다. 근데 영상 시연을 보니 GPT-4o가 떠오를 수 밖에 없네요. 성능은 비슷한 거 같은데, 아직 챗GPT만큼 진짜 사람 같진 않았습니다. 아무래도 오픈AI가 일부러 노린 거 같네요.

'아웃복서' 오픈AI와 '헤비급' 구글의 대결

오픈AI는 GPT-4o를 수 주 내에 공개한다고 했는데, 구글을 프로젝트 아스트라는 아직 '프로젝트'라는 게 좀 아쉽습니다. 아무래도 속도전에선 오픈AI를 따라가지 못하는 게 보입니다. 굉장히 많은 서비스를 선보였지만, 전날 오픈AI가 보여준 것처럼 인상적이진 않았어요. 강력한 '한방'이 없어 보인달까요. 오픈AI가 자사 서비스를 잘 포장해서 계속 앞서나가는 것처럼 보이는 전략을 잘 쓰는 거 같습니다. 계속 이런 구도가 되는 건 기업가, 투자자 냄새가 강한 샘 알트먼과 개발자 출신인 순다르 피차이의 스타일 차이도 한몫을 하는 거 같습니다.

그래도 프로젝트 아스트라가 하나 놀라웠던건, 아까 봤던 장면을 기억한다는 점이었습니다. "내가 안경을 어디에 뒀더라?"하니까 "책상 끝 사과 옆에 있어"라고 찾아 주더라구요. 역시 구글 제미나이가 기억력 하나는 확실히 좋습니다.

이 '기억력'이 구글의 중요한 포인트 같습니다. 구글은 세계 최대 인터넷 기업답게 방대한 데이터와 트래픽 처리에 능숙합니다. 인프라도 빵빵하죠. 그래서 현재 주력 AI 모델인 '제미나이 1.5 프로'는 무려 200만 토큰을 한 번에 처리합니다. 두 시간 분량의 영상, 22시간 분량의 오디오, 6만 줄의 코드, 140만개 이상의 단어를 한 번에 읽어들인다는 얘기입니다. 경쟁 모델인 'GPT-4 터보'가 12만8000 토큰인걸 감안하면 엄청난 체급입니다.

테크M

<이미지를 클릭하시면 크게 보실 수 있습니다>


구글은 이날 대규모 서비스를 대비한 '제미나이 1.5 플래시'도 공개했습니다. 좁은 범위의 작업이나 빈도가 높은 작업에 최적화된 제미나이 플래시는 응답 속도가 프로보다 더 빠르고 비용 효율적인 모델로, 프로 모델의 10분의 1 수준인 100만 토큰 당 35센트부터 시작합니다. 오픈AI가 GPT-4o API 비용을 GPT-4 터보의 절반 수준으로 줄였다고 하는데, 제미나이는 이보다 더 쌉니다. 제미나이는 기억력이 좋기 때문에 반복적인 작업에 추가 비용이 덜 듭니다. 최근 AI 기업들의 최대 고민인 비용 이슈에서 구글이 오픈AI 보다 유리한 고지에 있단 얘기입니다.

이런 제미나이의 경쟁력은 강력한 인프라에서 나옵니다. 구글은 이번 I/O에서 6세대 텐서처리장치(TPU) '트릴리움'을 공개했는데, 이전 세대인 TPU v5e에 비해 칩당 컴퓨팅 성능이 4.7배 향상됐다고 합니다. 앞서 구글은 Arm 기반의 자체 개발 중앙처리장치(CPU) '악시온(Axion)'도 공개했죠. 이런 AI 반도체 역량도 향후 경쟁에서 중요한 변수로 작용할 것으로 보입니다.

확실히 오픈AI가 카운터를 잘 날리긴 하지만, 잘 뜯어보면 역시 구글이 체급은 한 수 위로 보입니다. 구글은 AI 반도체, 데이터센터 인프라, 세계 최대 검색 플랫폼, 유튜브를 비롯한 각종 인터넷/모바일 서비스까지 없는 게 없습니다. 워낙 가진게 많고 그만큼 개발할 것도 많다보니 오픈AI 처럼 주먹이 날카롭진 않지만, 전반적인 파워로 보자면 비교 불가죠.

다음에 붙을 무대는 아이폰?

여기서 또 재밌는 경쟁 지점이 보이는데, 바로 애플이 가진 방대한 생태계를 노리는 오픈AI의 행보입니다. 최근 애플 아이폰에 챗GPT를 탑재하기 위한 라이선스 계약이 임박했단 소식이 들려오고 있습니다. 오픈AI는 GPT-4o와 함께 PC용 챗GPT를 윈도 보다 맥OS용으로 먼저 내놓는다고 발표하는 등 벌써 애플 친화적인 모습을 보이고 있습니다. 만약 이 계약이 성사된다면 오픈AI는 애플이 보유한 20억대 이상의 활성 기기 생태계에 숫가락을 얹으며 챗GPT 대중화의 거점을 마련할 수 있게 될 것입니다.

알려진 바와 같이 구글은 아이폰에 기본검색 설정으로 들어가기 위해 매년 수십조에 달하는 비용을 지불하고 있습니다. 그만큼 하드웨어 생태계에 서비스를 통합하는 일이 중요하단 얘기입니다. 그런데 아이폰에 챗GPT가 기본으로 탑재된다면 AI 경쟁 구도에도 상당한 파장이 있을 것으로 예상됩니다. 재밌는건 아직 애플이 구글과도 제미나이 탑재를 두고 협상하고 있다는 사실입니다. 아이폰을 둘러싼 구글과 오픈AI의 경쟁도 쫓고 쫓기는 AI 추격전에서 상당한 관전 포인트가 될 전망입니다.

테크M

<이미지를 클릭하시면 크게 보실 수 있습니다>


구글은 이번 행사에서 안드로이드에 '제미나이 나노'를 통합한다고 발표했습니다. 안드로이드는 스마트폰 운영체재(OS) 최초로 AI 모델을 기본 탑재하게 된 것입니다. 이를 통해 '픽셀'이나 삼성 '갤럭시' 등의 스마트폰에서 제미나이 나노의 멀티모달 인식 기능을 활용할 수 있게 됐습니다. 구글은 스마트폰 뿐만 아니라 스마트 글래스에도 제미나이가 탑재될 수 있다는 언급도 했습니다. 현재 삼성이 구글, 퀄컴과 확장현실(XR) 기기를 개발하고 있는 만큼, 향후 협력이 기대되는 부분입니다. 구글은 이미 AI 스마트폰, 혹은 AI 디바이스에 대한 경험이 쌓여있고, 당연히 노하우도 오픈AI에 비해선 많을 겁니다. 다만 구글은 스마트폰 시장에서 애플과 경쟁하는 사이기도 하고, 오픈AI가 GPT-4o를 통해 보여준 자연스러운 상호작용 능력이 스펙보다 사용자 경험을 중시하는 애플 입맛에 더 맞지 않을까 생각도 듭니다.

애플이 누구와 손을 잡느냐에 따라 구글이 온디바이스 AI 바닥을 석권하느냐, 오픈AI가 생태계를 확장하느냐가 판가름 날 전망입니다. 오는 6월 애플의 연례 콘퍼런스 '세계 개발자 대회(WWDC)'를 눈여겨 봐야 하는 이유입니다. 이번엔 톰이 이길 지, 또 제리가 이길 지, 또 한 번 흥미로운 대결이 될 것 같습니다.

남도영 기자 hyun@techm.kr

<저작권자 Copyright ⓒ 테크M 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.