컨텐츠 바로가기

04.25 (목)

인간 도움없이 독학한 알파고 제로, 범용AI 나오나

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[한겨레] 인공지능의 새 이정표 등장

기보, 인간기사 대국 전혀 없이
모든 대결 승리…바둑 새 경지
데이터 없는 영역도 인공지능 처리
데이터보다 알고리즘 가치 더 커져


한겨레

인공지능 시대에 인간의 일자리가 사라지고 있다는 내용을 다룬 서적이 ‘인간은 필요없다’(원제 Humans need not apply)라는 제목으로 지난해 출간됐다.


# 16년 동안 세계 체스챔피언 자리를 지켰던 전설적인 체스 그랜드마스터 가리 카스파로프는 1997년 아이비엠(IBM)의 체스용 슈퍼컴퓨터 딥블루와의 대결에서 패했다. 1996년 카스파로프와의 대결에서 패한 아이비엠은 더 많은 체스 그랜드마스터를 비밀리에 고용해 인공지능을 상대로 체스 대결의 다양한 상황을 훈련시키며 컴퓨터의 성능을 업그레이드해 1년 뒤 승리를 일궈냈다.

알파고가 이세돌 9단을 4-1로 꺾으며 바둑의 최강자가 되는 것을 보면서 소프트웨어 개발자들은 사람이 수행해오던 많은 영역의 일이 기계로 대체될 것이라고 비관했다. 앞으로 개발자의 주된 역할은 프로그램 개발이 아니라 인공지능에 데이터를 제공하는 일과 합리적으로 행동하지 않는 사람의 예측 불가능성을 알려주는 것이 될 거라고 말했다.

알파고 제로, 무엇이 달라졌나

인공지능 기술이 아무리 발전하더라도 인공지능을 훈련시키는 일을 하는 사람과 인공지능이 학습할 데이터는 필수적이기 때문에 그 영역에서 사람의 역할은 여전히 중요할 것이라고 여겨온 생각이 근본적 도전을 받게 됐다. 인공지능을 학습시키고 훈련시키는 일마저 사람의 몫이 아닐 수 있다는 우려가 확산되고 있다.

알파고를 개발한 구글 딥마인드의 대표 데미스 허사비스 등 17명은 지난 18일 영국의 과학 학술지 <네이처>에 ‘인간 지식 없이 바둑 마스터하기’라는 논문을 실었다. 딥마인드가 개발한 최신 바둑 인공지능 알파고 제로는 기존 버전들과 달리 사람 도움 없이 기본적인 바둑 규칙만 제공받은 상태로 출발했지만, 단기간에 경이적 성취를 이뤄냈다는 게 논문의 핵심이다.

한겨레

딥마인드가 공개한 알파고 제로가 자신을 상대로 둔 기보. 바둑의 규칙만 제공받고 스스로 학습을 시작한 알파고 제로는 첫 세시간까지는 바둑을 처음 배우는 사람처럼 세를 읽고 영역을 만드는 것보다 가능한 한 상대의 돌을 포위해 돌을 따내는 데 집중했다


알파고 제로는 바둑을 독학하기 시작한 지 36시간 만에 지난해 3월 이세돌 9단을 4 대 1로 이긴 버전(‘알파고 리’)의 실력을 넘어섰다. 알파고 제로가 72시간 독학 뒤에는 지난해 3월 이세돌과 동일한 대국 조건(제한 시간 2시간씩)에서 알파고 리와 대결한 결과, 100전 겨뤄 100승을 따냈다. 40일에 걸쳐 2900만판을 둔 뒤에는 올해 5월 세계 랭킹 1위 커제 9단을 3 대 0으로 꺾은 버전(알파고 마스터)의 실력마저 넘어섰다. 알파고 마스터와는 100전 89승 11패를 기록했다. 알파고 제로는 처음 3일까지는 바둑 초심자처럼 돌을 포위하는 것에 집중했으나 이후 고급 전략을 습득해 펼치기 시작했으며, 40일 뒤에는 그동안 존재하지 않던 새로운 정석을 발견하기도 했다.

알파고 제로는 딥러닝 방식과 함께 어떤 수가 승률을 높이는 좋은 수인지 피드백을 통해 스스로 바둑을 이해하는 강화 학습 전략을 택해 효과를 극대화했다. 공동 제1저자 3명 중 한 명이자 알파고 개발책임자인 데이비드 실버(유니버시티칼리지런던 교수)는 알파고 제로가 기존 버전들보다 오히려 강한 이유에 대해 “인간 지식의 한계에 얽매이지 않기 때문”이라고 설명했다.

한겨레

19시간이 지나자 돌의 사활 개념을 비롯해 핵심전략을 이해하기 시작했고, 독학 70시간이 지나자 프로기사의 실력을 뛰어넘는 수준의 바둑을 두기 시작했다.


알파고 제로 개발의 의미

<네이처>는 알파고 제로에 대해 “사람이 입력하지 않고 스스로 학습하는 인공지능은 모든 문제를 해결할 수 있는 범용 인공지능 개발의 꿈을 향한 핵심적 단계”라고 평가했다. 허사비스는 “가장 놀라운 것은 우리가 인간이 만든 데이터를 전혀 필요로 하지 않았다는 점이다”라고 말했다. <엠아이티(MIT) 테크놀로지 리뷰>는 알파고 제로는 인공지능이 학습할 충분한 데이터가 없는 현실의 어려운 문제도 해결책을 찾아낼 수 있다는 점에서 인공지능 개발의 중대한 진전이라고 평가했다.

그동안 데이터 축적과 확보를 무엇보다 중시해왔던 인공지능 연구 흐름에도 변화가 예상된다. 인공지능 기업들이 경쟁적으로 개발도구를 개방하고 생태계를 만드는 목적도 더 많은 데이터를 확보하기 위한 시도로 여겨져왔다. 근래 인공지능이 사진에서 고양이 이미지를 식별하는 진전을 이룬 것도 2007년부터 스탠퍼드대의 리페이페이와 프린스턴대의 리카이 교수가 수십억장이 넘는 사진을 모은 데이터베이스를 구축해 누구나 이를 활용할 수 있도록 무료 공개한 이미지넷 덕분이다.

한겨레

알파고 제로는 인간의 기보를 전혀 활용하지 않고 스스로 학습한 지 3일 만에 이세돌과 대국한 알파고 리를 능가했으며, 21일 만에 커제를 꺾은 알파고 마스터를 능가했다. 알파고 제로는 기존에 알려지지 않은 새로운 정석을 발견하며 바둑의 진전을 이루고 있다. 딥마인드 제공


인공지능이 축적된 데이터 없이도 학습할 수 있다면 기존의 인공지능 연구에서 데이터와 알고리즘 간의 관계를 역전시키는 결과로 이어질 수 있다. 데이비드 실버 교수는 “가용한 데이터나 컴퓨팅 능력보다 알고리즘이 훨씬 더 중요하다”고 <네이처>에 말했다. 인공지능이 뛰어난 알고리즘 개발만으로 데이터가 전혀 없는 영역에서도 인간 능력을 뛰어넘는 해결책을 제시할 수 있다는 기대를 제시하게 됐다. 동시에 이런 알고리즘 우선주의는 데이터를 생산하는 주체이자 인공지능을 훈련시키는 인간의 역할을 무가치하게 만들 수 있다.

지나친 평가를 할 필요가 없다는 지적도 있다. 인간의 바둑 학습과 달리 인공지능은 수백만번의 대국을 통해서 그 경지에 도달했기 때문이다. 미국 워싱턴대 교수 페드루 도밍구스는 “딥러닝과 강화 학습의 진전이지만 컴퓨터가 인간 지식 없이 배울 수 없다는 신호라고 보기는 어렵다”며 “이세돌이 챔피언에 오르기까지 둔 바둑 대국 횟수 정도만 알파고가 훈련한 뒤 이세돌을 꺾었다면 정말 놀라울 것이다”라고 <엠아이티 테크놀로지 리뷰>에 말했다.

알파고 제로가 인간 최고수를 넘어 신의 경지에 이르렀음을 보여준 바둑과 달리, 현실의 문제는 대부분 사람의 행동과 의지가 개입된 복합적 영역에서 생겨난다. 변수가 통제된 폐쇄 영역에서 보여준 인공지능의 능력이 개방적이고 복합적인 인간 삶의 영역에서 그대로 이어지기는 어렵다는 것은 인공지능을 두려워할 필요가 없다는 것을 알려준다.

구본권 사람과디지털연구소장 starry9@hani.co.kr

▶ 한겨레 절친이 되어 주세요! [신문구독]
[사람과 동물을 잇다 : 애니멀피플] [카카오톡]
[ⓒ한겨레신문 : 무단전재 및 재배포 금지]


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.