컨텐츠 바로가기

05.05 (일)

한층 강해진 인공지능, 바둑·포커 이어 ‘도타2’도 접수?

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[한겨레] [한겨레 미래&과학]

28일 프로선수팀과 ‘도타2’ 대결

바둑·포커 평정 이어 새 도전

‘1 대 1’ 아닌 ‘5 대 5’ 팀플레이

팀내 협업 능력이 승패를 좌우

준프로급과 경기선 이미 승리

매일 180년치 게임하며 연습중



한겨레

<이미지를 클릭하시면 크게 보실 수 있습니다>


인공지능이 인간과 겨루기에 바둑과 컴퓨터 게임 가운데 무엇이 더 까다로울까? 직관적으로는 수천 년 역사의 심오한 바둑보다 같은 컴퓨터로 만들어진 게임이 더 쉬워 보인다. 하지만 들여다보면 게임이 오히려 인공지능에 훨씬 어려운 과제로 꼽힌다. 이세돌을 꺾은 구글 딥마인드 쪽이 당시에 다음 과제로 컴퓨터 게임 “스타크래프트”를 언급한 데에는 이유가 있는 것이다. 그런데 인간이 바둑 최강의 자리를 기계에 내준지 2년 만에 컴퓨터 게임마저 내줄 것 같은 전조가 최근 나타나고 있다. 이르면 내달 캐나다 밴쿠버에서 열리는 ’도타(Dota)2’라는 게임의 세계 대회, ’인터내셔널’이 그 자리가 될 수도 있을 전망이다.

우선 도타2라는 경기 종목을 먼저 살펴보자. 컴퓨터 게임에 대한 문외한이라도 게임 종류가 무수히 많다는 사실은 대부분 알고 있다. 옛날 오락실에 유행하던 ’갤러그’ 같은 단순한 게임은 인간 능력을 능가하는 인공지능을 만들기가 어려운 일도 아니고, 실제 알파고 전에 이미 만들어졌으며, 그 의미도 대단치 않다. 컴퓨터 게임에서 인간을 눌렀다고 하려면 충분히 복잡하고 주목받는 게임을 종목으로 해야 마련이다.

2013년 출시된 도타2는 세계적으로 평균 45만명의 사람이 늘 즐기고 있는 인기 게임이다. 그만큼 이스포츠(e-sports)도 활성화되어 있어서 매년 최강자를 가리는 ’인터내셔널’에 세계 각지의 팬들이 모여든다. 2016년 인터내셔널의 총상금은 모든 이스포츠 대전 가운데 가장 많은 2000만 달러(약 224억원)로, 윔블던 테니스의 총상금을 능가했다.

컴퓨터 게임에서 인공지능이 인간보다 불리한 이유는 크게 2가지가 꼽힌다. 정보가 불완전한 경기라는 것과 실시간으로 복잡한 계산을 해야 한다는 점이다. 바둑의 경우 선수는 19×19의 바둑판을 함께 보며 겨룬다. 감춰진 수 없이 현재 판세에서 최선의 수만 두면 된다. 하지만 포커나 도타2와 같은 게임의 경우 현재 게임 상황에 대한 정보가 선수에게 모두 제공되지 않으며 이 미지의 정보가 승패에 중요한 역할을 한다. 알파고의 아버지 데미스 허사비스는 이런 조건은 “인공지능이 정복하기 매우 어렵다”고 말한 바 있다. 하지만 불완전 정보의 경우 지난해 1월 인공지능이 최고의 포커 꾼들을 상대로 승리를 거두면서, 어느 정도 대응이 가능하다는 점이 입증됐다.

컴퓨터 게임의 다른 문제는 바둑을 능가하는 더 많은 변수의 판단을 짧은 시간에 끊임없이 내려야 한다는 점이다. 바둑의 경우, 우주의 원자보다 많은 경우의 수가 있다고는 하지만 경기당 제한시간을 2시간으로 보았을 때 평균 48초당 바둑판 위에 한 수를 두면 그뿐이다. 하지만 도타2 같은 게임의 경우 초당 30장면으로 게임 상황이 끊임없이 바뀌며, 따라서 1초에도 몇번씩 최적의 수를 내야 한다. 선택지도 매우 다양하다.

도타2라는 게임은 여기에 인공지능에 까다로운 과제를 하나 더 추가한다. 1대1로 겨루는 바둑과 달리 도타2는 다섯이 한팀이 되어 팀대팀으로 겨루는 게임이다. 그래서 설사 자신이 손해를 보더라도 팀에게 이득이 되는 ’희생 플레이’가 승리에 중요하다. 지금까지 인공지능은 대부분 자신의 승리를 위해 최선의 이득을 얻는 것을 목표로 설계됐다. 인공지능에게 이런 협업을 학습하도록 가르칠 수 있느냐가 도타2가 심판하는 중요한 지점이 되는 셈이다.

이런 만만치 않은 과제에 도전장을 내민 곳은 테슬라의 최고경영자 일론 머스크가 후원하는 ’오픈에이아이’(OpenAI)다. 오픈에이아이는 소수가 소유하는 인공지능이 인류의 위협이 되리라고 주장해 온 머스크를 비롯한 몇몇 후원자가 만든 비영리 회사로 모두에게 이로운 인공지능 개발을 목표로 하고 있다.

한겨레

<이미지를 클릭하시면 크게 보실 수 있습니다>


이 도전이 가볍게 보이지 않는 이유는 이미 상당한 성과를 냈기 때문이다. 오픈에이아이의 인공지능은 2017 도타2 인터내셔널에서 최고 선수 가운데 하나로 꼽히는 ‘수마일’(SumaiL·?게임 아이디)?을 1대1 대결에서 물리쳐 그 가능성을 보였다. 하지만 언론의 본격적인 주목을 받은 것은 지난달 25일 최초의 인공지능 도타2팀, ’오픈에이아이 파이브’(이후 파이브)가 준프로급의 선수들과 5대5 경기를 벌여 승리(3전2승)를 거둔 것이다.

1대1 경기는 개인의 조작능력에 영향을 많이 받고, 프로그램인 인공지능은 조작에 결점이 없기 때문에 승리가 놀라운 일은 아니다. 그러나 팀전에서 승리는 많은 이들이 예상치 못한 것이었다. 마이크로소프트 창업자 빌 게이츠는 자신의 트위터를 통해 이 경기를 두고 “획기적인 사건”이라고 평했다. 이는 “협업과 팀워크 없이 이룰 수 없는 승리”라는 것이다. 오픈에이아이에 의하면 파이브의 5개 인공지능은 경기 외에는 서로 정보를 주고받지 않는 각각 독립적인 개체라고 한다.

(포털에선 인용 트윗이 깨져 보입니다.)

#AI bots just beat humans at the video game Dota 2. That’s a big deal, because their victory required teamwork and collaboration ? a huge milestone in advancing artificial intelligence. https://t.co/UqIUhh9xFc— Bill Gates (@BillGates) 2018년 6월 26일

인공지능 기술은 어떻게 2년 만에 또다시 이런 괄목할만한 발전을 눈앞에 두게 되었을까? 알고리즘이 스스로 원리를 익히는 강화학습(reinforcement learning)의 예상을 초월한 잠재력이 원인으로 꼽힌다. 강화학습이란 기본적인 규칙만 알려주고 인공지능이 약간씩 변형한 자신의 다양한 버전과 계속해 싸우면서 스스로 익히는 기계학습의 방식을 말한다. 오픈에이아이는 팀전 승리 뒤 “이번 결과는 우리가 강화학습 알고리즘의 잠재력에 대한 믿음이 부족했다는 것을 의미한다”고 설명했다. 충분한 연산력과 적절한 설계만 있으면 강화학습으로 팀워크와 같은 이타적인 행동까지 익힐 수 있다는 이야기다.

중앙연산장치(CPU) 코어 12만8천개를 단 파이브 인공지능은 매일 180년 치의 게임 플레이를 해치우면서 모든 전략을 스스로 개발했다. 알파고가 인간의 기보를 우선 학습했던 것과 달리 파이브의 행동은 모두 스스로 깨우친 것이다. 이런 강화학습 방식으로 만들어진 알파고의 후속 버전 ‘알파고제로’(AlphagoZero) 역시 3일을 혼자 훈련해서 알파고를 100대 0으로 이긴 바 있다. 다음 달이면 이스포츠의 왕좌마저 기계에 내주는 모습을 지켜봐야만 할까. 아직 승부를 점치기는 이르다는 반론도 있다. 파이브의 경기 내용을 들여다보면 인공지능의 강점뿐 아니라 한계도 엿보인다. 도타2에서 플레이어는 100종류가 넘는 영웅 가운데 하나를 골라 경기를 시작하게 되는데 파이브는 이 가운데 오직 5종류의 영웅으로만 학습하고 경기를 치렀으며, 상대방 인간팀도 이 5종류로만 경기하도록 규칙에 제한이 있었다. 아무리 놀라운 학습량을 자랑해도 짜인 틀 안에선 놀라운 능력을 보여주지만 틀 밖으로 벗어나면 구실을 할 수 없는 현 인공지능의 한계를 파이브도 여전히 안고 있는 셈이다. 이 때문에 인도의 기술 매체 <더 와이어>는 익명의 플레이어를 인용해 인간 최고수가 제트스키를 탄다면 파이브는 “아직 보조 바퀴가 달린 자전거를 타는 수준”이라고 평가한 바 있다.

오픈에이아이는 2018 도타2 인터내셔널에 앞서 오는 28일 프로 수준의 인간팀과 경기를 펼칠 계획이라고 밝혔다. 알파고부터 계속해서 예상을 넘어서는 능력을 보여왔던 인공지능의 행진이 과연 어디까지 이어질지 관심이 쏠린다.

권오성 기자 sage5th@hani.co.kr

▶ 한겨레 절친이 되어 주세요! [오늘의 추천 뉴스]
[▶ 블록체인 미디어 : 코인데스크] [신문구독]
[ⓒ한겨레신문 : 무단전재 및 재배포 금지]


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.