컨텐츠로 건너뛰기
검색
디지털데일리 언론사 이미지

[AI 유니온] 모니터 찢고 나온 AI…"2026년은 현실로 진격"

디지털데일리 이건한 기자
원문보기

[AI 유니온] 모니터 찢고 나온 AI…"2026년은 현실로 진격"

서울맑음 / -3.9 °
[초지능 추적기] ① 디지털 세계는 접수 완료... 현실 겨냥한 AI 로드맵 실현 본격화
오늘날 인공지능(AI)이 스며들지 않은 곳은 더이상 없습니다. 그러나 다 같은 AI는 아닙니다. 각각의 역할이 다르며 다채로운 AI와 동행하며 살아갈 우리 사용자들이 미리 알아야 할 '새시대의 상식'도 그만큼 많아질 전망입니다. 이에 IT 전문 미디어 디지털데일리는 통합 기획 'AI 유니온(Union)'을 통해 기자들이 심도 있게 살펴본 여러 AI 융합분야의 기술, 산업, 사회 현상 등의 면면을 알기 쉽게 전해드리겠습니다. <편집자주>




[디지털데일리 이건한기자] 훗날 인류 역사에서 2025년은 'AI 시대의 역사적 분기점'으로 기록될지 모르겠습니다. 적어도 지난 1년 사이로 시야를 좁히면 우리는 AI가 '진짜 인간을 닮아가는 시대'란 무엇일지 꽤 구체적인 청사진을 확인해볼 수 있었기 때문입니다. 물론 AI에 관심있는 독자들에게 그 연장선인 AGI(범용일반지능, 인간 수준 도달)나 ASI(초지능, 인간 한계 돌파)라는 말은 사실 꽤 진부하게 들릴 수 있습니다. 현실은 초지능 실현의 날이 아직 멀었다는 사실도 알고 있으리라 생각합니다.

하지만 그럼에도 이제는 일명 '초지능 추적기'를 본격 가동해볼 시기가 됐습니다. 2025년은 AGI는 물론이고 ASI로 넘어가기 위한 여정의 큰 그림이 구체화된 만큼, 이제는 그에 근거해 어떤 기술과 사건이 인류를 초지능의 시대로 한걸음씩 내딛게 하는지 살펴볼 필요가 있기 때문입니다. 한마디로 지난 2022년, 예고 없이 등장해 세상을 잠시 AI 패닉에 빠뜨렸던 챗GPT의 전철을 다시 밟는 일은 피하자는 의미입니다. 또한 준비되지 않은 초지능 시대의 충격은 단순히 말만 잘했던 초기 챗GPT의 등장과는 결이 다른 충격을 안길 것이기 때문이기도 합니다.

이에 디지털데일리의 AI 심층 기획 '초지능 추적기' 시리즈는 AGI, ASI로 발전하고 있는 전세계 AI 기술 산업의 주요 이정표를 긴 호흡으로 조명해 나갈 예정입니다. 매 편마다 핵심 개념을 누구나 알기 쉽게 설명하며 쓸만한 시사점을 발굴해드리겠습니다. 우선 첫 순서는 구체화된 초지능 시대 전환 로드맵의 면면을 단계적으로 살펴봅니다.

◆말만 잘하는 '확률적 앵무새'의 한계

먼저 현시점 AI의 수준과 한계부터 명확히 정의할 필요가 있습니다. 사실 2024년까지 세상을 떠들썩하게 했던 LLM(대형언어모델) 기반 AI 서비스들은 엄밀히 말해 고도화된 ANI(좁은 인공지능)에 불과했습니다. 여기서 '좁다'는 표현은 그 AI들의 한계는 단지 '인간처럼 말만 잘했다'는 의미입니다. LLM의 본질은 방대한 인간 지식 데이터에서 학습한 통계적 패턴을 이용해 'AI가 이어질 문장에서 가장 그럴 듯한 단어를 고르도록 돕는 것'이었기 때문입니다.

그럼에도 사람들이 그만한 AI에 열광했던 것은 구글이 개발한 LLM의 원천 기술, '트랜스포머(Transformer)'라는 아키텍처가 '확률적 문장 생성'의 정답률을 놀랍도록 끌어올렸던 까닭입니다. 마치 TV를 처음 본 인류가 TV 안에 사람이 있다고 착각했던 것처럼 우리가 AI에게 지성이 생겼다고 착각하는 일이 일어났던 겁니다. 실제로 트랜스포머를 개량해 만든 오픈AI의 GPT 모델 기반 '챗GPT 서비스'는 AI 안에 정말 사람이 있는 것처럼 자연스러운 대화 수준을 보였습니다.

하지만 그 한계는 금방 들통나고 말았습니다. 언어 구사 능력에 집중된 초기 LLM은 어떤 질문에 대한 답도 모두 확률적으로 찾아낼 뿐이었습니다. 가령 '사과는 빨갛다'는 문장도 실제 사과의 형태나 색을 상식적으로 이해하고 내놓은 답이 아니었다는 뜻입니다. 또한 현실의 인간 세상을 이해하지 못하므로 특정 문제 이면에 숨겨진 인과관계나 물리 법칙도 진정으로 이해하지 못했습니다. 이 가운데 가장 큰 문제는 '자신이 모른다는 사실을 모른 채' 그럴듯한 답변을 지어내는 AI '환각(Hallucination)' 현상의 대두였습니다.


이에 지난 2024년까지 AI 업계의 가장 시급했던 숙제도 환각 문제의 해결, 그리고 텍스트 외 세상(이미지, 비디오, 오디오, 현실 등)을 이해하는 멀티모달(Multimodal) AI의 개발이었습니다. 가장 기초적인 이 벽을 넘지 않으면 AI의 신뢰성이 보장될 수 없었고, AI가 도울 수 있는 인간의 일도 그만큼 제한될 것이기 때문이었습니다.

◆"잠깐, 생각 좀 하고요"... 뜸 들이는 AI가 더 똑똑하네

이런 문제 해결 노력에 대한 결실은 지난 2025년 한 해 동안 쉴 틈 없이 터져 나왔습니다. 특히 멀티모달 이슈는 놀라운 수준으로 향상된 AI의 이미지 생성(챗GPT 지브리 스타일, 구글 나노바나나 열풍 등), 영상 생성(오픈AI 소라2, 구글 비오3), 오디오 생성(수노, 뉴튠 등) 결과물들을 통해 빠른 해결 가능성이 엿보였습니다. 최근 유튜브 등지에서는 이미 AI 영상과 실제 영상을 구분하기 어려운 점이 큰 이슈로 부각되고 있을 정도입니다.

환각 문제 해결도 진전을 보였습니다. 바로 AI의 신중한 사고를 돕는 '추론(Reasoning)' 기술과 RAG(검색증강생성), 온톨로지(Ontology)로 불리는 신뢰성 보완 기술들이 순차적으로 등장한 덕분입니다. 특히 "말하기 전에 생각했나요?" 같은 밈(Meme)이 연상되는 추론 중심 AI 모델들(GPT-5 Thinking, Gemini 3 Pro 등)의 부상은 지난 2025년 AI가 더욱 본격적으로 인간의 사고 체계를 닮아가는 과정에 진입했다는 증거였습니다. 이는 노벨 경제학상 수상자 대니얼 카너먼의 2011년 저서 '패스트&슬로우'에서 널리 알려진 인간의 사고 체계와도 비슷합니다.





카너먼은 해당 책에서 인간의 사고는 질문에 즉각적으로 반응하는 '시스템 1(직관형)'과 느리지만 논리적으로 숙고하는 '시스템 2(추론형)'으로 구분된다고 설파했습니다. 구체적으로 사람의 표정을 인지하는 것처럼 사고 없이 순간적으로 판단 가능한 것이 직관에 따른 '시스템1', 수학 계산처럼 문제 풀이에 단계별 추론이 필요한 것이 '시스템 2'에 해당합니다. 물론 이런 분류가 다소 복잡하게 보이기도 하지만 확실한 건 높은 생산성이 따르는 업무 처리, 인류 발전에 기여할 과학 연구 등은 모두 '추론 기반 시스템 2' AI의 역할이 중요하다는 것입니다.

2025년은 이 영역에서 다양한 성장 가능성이 검증됐습니다. 특히 고차원의 논리와 수학적 사고가 필요한 프로그램 코딩 영역에서 주요 AI 모델들은 비약적인 발전을 이뤘습니다. 현재 '돈 먹는 하마'인 AI 개발 사업에서 코딩 AI는 '돈을 버는' 흔치 않은 사례로 꼽힐 만큼 현장의 실수요도 높은 편입니다.

무엇보다 추론 AI의 진화는 단순한 성능 향상에 그치지 않습니다. AI가 단순 암기를 넘어 기존 훈련 데이터에 없던 새로운 규칙을 스스로 학습하고 적용하는 '유동 지능(Fluid Intelligence)'을 갖출 기반이 마련된 점도 주목할 만합니다. '스스로 발전할 수 있는 AI' 역시 AI가 인간의 사고 수준을 넘어서는 초지능으로 향하기 위한 주요 이정표이기 때문입니다.


◆검색만 하던 AI 비서, 이젠 '법인카드'도 긁어

'깊이 사고하는 AI'의 다음 단계는 '행동(Action)'입니다. 우리가 소위 'AI 에이전트(Agent)'라고 부르고 있는 단계를 말합니다. 에이전트의 핵심은 AI가 특정 기능이나 서비스를 사용자의 개입 없이 능동적으로 수행하는 것입니다. '추론'을 통해 '결정'을 했으면 '행동'이 따라야 AI가 비로소 '완결성'을 갖기 시작했다고 말할 수 있으니까요.

예컨대 에이전트 시대 이전 AI는 "제주도 항공권을 찾아줘"라는 질문에 검색 결과 링크만 던져줬습니다. 반면 AI 에이전트는 사용자의 일정과 선호도를 고려해 최적의 항공편을 예매하고 숙소를 예약하며 렌터카까지 결제한 뒤 최종 일정표를 보고할 수 있습니다. 이 과정에서 발생하는 여러 변수와 분기점을 스스로 판단하거나 사용자의 승인을 받는 방식이지요. 이는 AI가 '에이전트'라는 이름처럼 개인의 일상과 기업의 생산성 향상을 폭발하는 도구로 진화하기 시작했다는 의미입니다.




다만 범용성과는 아직 거리가 멉니다. 현재 에이전트 시스템은 보통 1~2가지 단순한 업무를 자동화하는 수준이기 때문입니다. '코딩 에이전트', '쇼핑 에이전트' 같은 식으로 말입니다. 불과 하나의 뇌와 한 쌍의 손만으로 수만가지 일을 해낼 수 있는 인간과 비교하면 아직 멀었다는 이야기이지요.

대신 하나의 AI 모델이 더 다양한 일을 할 수 있도록 다양한 기능성 에이전트를 각각의 팔다리처럼 모델에 연결하는 'MCP(모델 컨텍스트 프로토콜)'라는 기술이 최근 주목을 받고 있습니다. MCP는 일종의 AI 버전 'USB'라고 할 수 있는데요. 우리가 PC에 달린 USB 포트만 있으면 이와 호환되는 각종 전자기기를 PC에 쉽게 연결해 쓸 수 있는 것과 같은 개념입니다. 오픈AI의 주요 경쟁사 앤트로픽이 2024년에 처음 공개한 기술이며 현재 업계의 에이전트 AI 시스템 구현 표준 프로토콜로 널리 쓰이고 있습니다.

◆ AI는 '디지털 여포?' 이제 현실로 나온다

정리하면 2025년까지 AI는 말하고, 사고하며, 행동하고, 서로 연결되는 수준까지 이르렀습니다. 이제 적어도 가상 세계에서는 인간을 꽤 닮게 됐다고 볼 수 있겠습니다. 하지만 아직 갈 길이 멉니다. 진정한 AGI, 나아가 인간을 초월하는 초지능으로 가려면 AI도 반드시 세상 밖으로 나와야 합니다. 바로 최근 글로벌 AI 산업의 화두인 '피지컬(Physical, 신체적) AI' 단계를 의미하는데요. 안타깝게도 관련 업계에 따르면 피지컬 AI의 발전 속도는 이전과 달리 대단히 더딜 것으로 예상됩니다.

그동안 AI가 존재했던 '디지털 세계'는 어떤 면에서 아무런 자극 없이 안락했던 천국이었습니다. 반면 '현실 세계'는 다릅니다. 글로 배운 물리학 지식만으로는 '컵을 집거나 문을 여는' 수준의 아주 단순한 행위조차 수행하기 어려운 까닭입니다. 예컨대 사람에게 문을 어떻게 여는지 설명하라고 하면 "그냥 손잡이를 잡고 돌리거나 당긴다" 정도면 충분합니다.

나머지는 익숙한 현실 감각과 경험에 따라 무의식적으로 처리되는 정보들이지요. 반면 로봇 AI에게는 '어떤 문인지', '손가락을 몇 센티미터 움직일지', '어떻게 잡고 돌려야 고장나지 않을지' 등등 모든 현실이 낯섭니다. 이를 이해하려면 물리 법칙이 적용된 현실 데이터, 로봇의 직·간접 경험 데이터가 필수인데, 그 수가 필요한 양에 비해 매우 적습니다. 당연하지만 인류는 인간 학습에 필요하지 않은 데이터를 언제 등장할지 모르는 AI를 위해 한 번도 꼼꼼히 쌓아 둔 적이 없거든요.




어쨌거나 문제는 풀어야 합니다. 이 난제를 해결하기 위해 비교적 가장 최근에 등장한 개념이 바로 '월드모델(World model)'입니다. 'AI를 위한 가상의 현실세계'이지요. 핵심은 AI가 직접 세상에 나오지 않고도 현실의 물리법칙을 이해하고 능동적으로 행동해볼 수 있는 시뮬레이션 공간을 만드는 것입니다.

그 안에는 중력, 마찰, 충돌, 소리 등 인간 행동에 영향을 미치는 모든 요소가 포함될 수 있습니다. 물론 비록 지금은 아무리 정교한 월드 모델도 현실을 100% 구현하지 못합니다. 대신 현시점 AI는 우선 이 세계 안에서 무한한 시행착오를 거치며 물리 세계의 법칙을 이해하는 과정을 보내는 중입니다.

또한 현실은 닮은 월드 모델의 발전은 진정한 메타버스의 등장, 현실 같은 가상세계 구현으로 향하는 잠재력도 지니고 있습니다. 피지컬 AI 훈련 공간으로서 의미와 별개로 AI를 통한 '디지털 지구'가 미래에는 아주 많이 생겨날 수도 있다는 의미입니다.

한편 가상 환경의 한계를 극복하기 위해 제한적이지만 인간이 직접 로봇을 위한 행동 데이터를 촬영해 제공하거나 로봇의 움직임을 직접 제어하며 행동에 필요한 데이터를 학습하도록 하는 보완적 기술들도 피지컬 AI 구현을 위해 꾸준한 연구가 이뤄지고 있습니다.

◆ 아직 먼 초지능2026년은 '동행하는 AI'부터

이처럼 AGI, 초지능으로 향하는 여정은 현재 AI가 실체화된 형태로 세상에 출현하는 피지컬 AI 시대의 도입 초반까지 이르러 있습니다. 2026년에는 한층 강화된 추론 능력으로 인간이 발견하지 못한 지식을 발견하는 연구자 AI, 제조 현장을 중심으로 인간의 정교한 노동을 대체하는 피지컬 AI 휴머노이드 로봇 등이 본격적으로 등장할 전망입니다.

다만 그것만으로 여전히 우리가 상상하는 AGI나 초지능에 이르렀다고 보긴 어렵습니다. 추론, 기획, 결정, 행동, 현실 대응에 이르는 모든 영역에서 AI가 인간을 넘어서려면 아직 완성도 측면에서 몇 년의 시간이 더 걸릴지 모르기 때문입니다.

이밖에 기사에선 언급하지 않았지만 현재 AI 모델 아키텍처에서 사용하는 방대한 양의 전력 에너지 문제 완화, 이를 타개할 전혀 다른 형태의 아키텍처 개발 필요성 등도 꽤 중요한 문제입니다. 경제성 또한 AI의 더 많은 활용, 확산에 중대한 영향을 미치는 요소이기 때문입니다.

'초지능 추적기' 시리즈는 앞으로 이러한 기술적 성취들을 하나하나 뜯어보고 그 이면에 도사린 '정렬(Alignment, AI의 인간성)' 문제와 같은 리스크까지 냉철하게 짚어볼 예정입니다. 기술은 이미 준비를 마쳤습니다. 이제는 우리가 그 변화의 파고를 이해하고 올라탈 준비를 해야 할 때입니다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -