빌 게이츠 마이크로소프트 창업자는 지난 6월 팟캐스트에서 “메타인지가 인공지능의 다음 개척지”라고 주장했다. 유튜브 제공 |
데이터·알고리즘·칩 성능 강화
‘스케일업’ 전략 경쟁에 GPU 특수
오픈AI·저커버그·머스크 등 경쟁
더 강력한 컴퓨팅 능력이냐, 아니면 사람을 닮은 새로운 사고방식이냐.
사람 지능 수준을 능가하는 ‘범용 인공지능(AGI)’에 도달하기 위한 방법을 두고 서로 다른 접근법이 경쟁하고 있다. 하나는 현재 인공지능 모델의 데이터와 연산 규모를 극대화하는 방식으로 범용 인공지능에 도달할 수 있다는 ‘스케일 업(확장)’ 전략이다. 다른 경로는 현행 딥러닝과 거대언어모델 방식으로는 인간 지능을 뛰어넘을 수 없기 때문에 전혀 새로운 방법이 필요한데, 그것은 인간 사고의 특징인 ‘메타인지’라는 주장이다.
더 강력한 칩, 더 많은 데이터 추구
범용 인공지능 구현을 내걸고 출범한 오픈에이아이(OpenAI)는 스케일 업을 통한 접근법이 가능하다는 전략을 추구한다. 딥마인드 설립자 데미스 허사비스도 지난 5월 구글 연례 개발자회의(구글I/O)에서 “범용인공지능의 일부 기능을 연말께 구글 제미나이 같은 서비스에서 제공할 예정”이라고 말했다. 샘 올트먼 오픈AI 최고경영자와 젠슨 황 엔비디아 최고경영자 또한 5년 뒤께 범용 인공지능을 구현할 수 있을 것이라고 본다.
2017년 구글의 트랜스포머 논문 이후 생성 인공지능이 등장하며 기술 발전이 가속화하고 있다. 오픈AI가 2022년 11월 챗GPT를 선보이고, 2023년 3월 GPT4, 2024년 5월 GPT4옴니를 공개한 데 이어, 앤트로픽·바이두·메타·아마존·애플 등 기술업체들이 개발 경쟁에 뛰어들면서 인공지능 모델은 빠르게 개선되고 있다. 현재와 같은 방법으로 더 방대한 데이터, 더 정교한 알고리즘, 더 강력한 컴퓨팅을 통해 규모와 속도를 확장해가는 스케일 업 전략을 지속하면, 5년 뒤쯤엔 범용인공지능이 등장할 것이라는 믿음을 공유하는 진영이다.
이 전략은 엔비디아의 인공지능 반도체(H100) 확보 경쟁으로 나타나고 있다. 엔비디아의 지피유(GPU)칩 H100은 인공지능 훈련·개발에 필수적인데 3만~4만달러 칩이 품귀 현상을 빚고 있다. 일론 머스크는 지난 22일 소셜미디어(X)를 통해 자신이 설립한 인공지능 스타트업 엑스에이아이(xAI)의 챗봇 ‘그록3(Grok3)’이 이날 새벽부터 훈련에 들어갔다고 밝혔다. 여기엔 H100칩 10만개가 투입됐는데 칩 비용만 30억~40억달러(약 4조~6조원) 규모다.
지난달 22일 일론 머스크 테슬라 최고경영자는 자신이 설립한 인공지능 스타트업 xAI의 챗봇 그룩3가 훈련을 시작했다며, 멤피스 데이터센터를 방문한 사진을 소셜미디어 X에서 공유했다. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
메타의 최고경영자 마크 저커버그는 지난 2일 실적발표에서 “(차세대 AI모델) 라마4 훈련에 돌입했는데 종전 모델 라마3.1보다 10배 많은 지피유를 투입할 예정”이라고 밝혔다. 이는 약 16만개에 달하는 지피유 클러스터를 구축한다는 의미로, 세계 최대규모의 슈퍼컴퓨팅 인프라다. 저커버그는 올해 말까지 35만개의 H100 칩을 구매할 예정이라고 말한 바 있다. 10조원을 훌쩍 넘는 규모다.
얀르쿤 “거대언어모델 의존은 한계”
게이츠도 AI에 메타인지 가르치면
“AI의 신뢰성·정확성 해결 가능”
‘확장’으론 한계…메타인지 주목
하지만 이런 스케일 업 전략으로는 인간 수준의 지능을 구현할 수 없을 것이라고 주장하는 진영이 있다. 얀 르쿤 뉴욕대 교수는 지난 5월 ‘파이낸셜타임스’ 인터뷰에서 “거대언어모델은 절대로 범용인공지능에 도달할 수 없다”라고 말했다. 논리 이해가 매우 제한적이며, 물리세계를 이해하지 못하고, 지속적 기억력이 없으며 계획을 세울 수 없다는 게 이유다.
마이크로소프트 창업자 빌 게이츠도 확장 전략의 한계를 지적했다. 빌 게이츠는 인공지능 연구에서 학습 데이터와 컴퓨팅 능력의 규모를 키우는 방식으로는 도약을 이룰 수 없다고 단언했다. 그는 “메타인지가 인공지능의 다음 개척지다”라며, 돌파구로 제시했다.
인지심리학에서 ‘메타인지(상위인지)’는 자신의 인지 상태에 대한 자각을 뜻하는 개념으로, 자신을 객관화할 수 있는 능력을 의미한다. 단편적 지식이나 판단 능력이 아니라 자신의 인지 여부와 감정 상태 전체를 객관화할 수 있는 능력이고 특히 자의식과 연결돼 있어, 인간만이 지닌 능력으로 여겨진다.
빌 게이츠는 지난 6월28일 팟캐스트 ‘넥스트 빅아이디어클럽’에 출연해 메타인지를 “넓은 의미에서 문제에 대해 생각하고 한 걸음 물러나서 ‘이 대답이 얼마나 중요한가? 내 답변을 어떻게 확인할 수 있으며, 어떤 외부 도구가 도움이 될까?’라고 생각하는 능력”이라고 구체화했다.
그는 GPT4나 페이스북 라마와 같은 기존 거대언어모델의 전반적인 인지 전략은 아직 정교함이 부족하다고 말했다. 그는 연구자들이 메타인지 전략을 사용하여 인공지능 모델이 더 똑똑하게 생각하도록 가르쳐야 한다고 강조했다. 사람처럼 문제에서 한발 물러서서 거리를 두고, 그 문제 자체에 대해 질문하는 ‘메타인지’ 능력이다. 게이츠는 “메타인지 연구는 거대언어모델의 가장 골치 아픈 문제인 신뢰성과 정확성을 해결하는 열쇠가 될 수 있다”고 말했다. 게이츠는 팟캐스트 대담에서 현재의 인공지능모델이 비디오데이터와 합성데이터를 다루게 되면서 두 차례 확장의 기회를 맞겠지만, 한계가 명확하다고 말했다.
구본권 사람과디지털연구소장 starry9@hani.co.kr
▶세상을 바꾸는 목소리에 힘을 더해주세요 [한겨레 후원]
▶▶무료 구독하면 선물이 한가득!▶▶행운을 높이는 오늘의 운세, 타로, 메뉴 추천 [확인하기]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.