컨텐츠 바로가기

07.01 (월)

알파고 뛰어넘는 ‘독학파’ 알파고 제로

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

구글 딥마인드 팀 ‘대국 없이 바둑 마스터’ 새 인공지능 공개

구글 딥마인드 팀이 인간 최고수들을 격파한 ‘알파고’를 압도하는 새 인공지능 ‘알파고 제로’를 공개했다. 지금까지의 인공지능이 외부에서 데이터와 인간 지식의 도움을 받아야 했다면 알파고 제로는 대국상대 없이 순순히 독학만으로 인간이 수천년 동안 개발한 바둑 이론을 깨달았다.

구글 딥마인드의 창업자인 데미스 허사비스 최고경영자(CEO) 등 이 회사 소속 연구원 17명은 19일(한국시간) 이런 내용을 포함한 ‘인간 지식 없이 바둑을 마스터하기’라는 제목의 논문을 과학 학술지 ‘네이처’에 발표했다.

지금까지의 인공지능 학습은 모두 방대한 양의 데이터와 전문 지식의 도움을 받은 것이다. 지난해 3월 이세돌 9단을 이겼던 ‘알파고 리’ 역시 수개월간 데이터를 학습했고 수천명의 인간 고수들과의 대국을 거치며 실력을 키웠다.

이렇게 인공지능을 훈련시키는 데는 많은 비용과 시간이 걸린다. 인간의 지식이나 선입견이 오히려 한계로 작용할 수 있다.

허사비스는 “인간 지식은 너무 비싸고 신뢰할 수 없거나 이용할 수 없다는 문제가 있다”며 “인공지능 연구의 오랜 과제는 인간의 도움 없이도 초인적인 문제 해결 능력을 보이는 알고리즘을 만들어 이런 단계를 건너뛰는 것이었다”고 말했다.

그 해법으로 최근에는 인공지능이 스스로 수많은 시행착오를 통해 요령을 터득하는 ‘강화학습’(reinforcement learning) 연구가 활발하다. 강화학습 방식으로 만들어진 알파고 제로는 바둑규칙 외에는 사전 지식이 없는 상태에서 스스로 바둑을 두면서 이치를 터득했지만 지금까지의 알파고 중 가장 강력하다. 알파고 제로는 72시간 학습한 후 ‘알파고 리’와 대국한 결과 100전100승을 기록했다. 40일에 걸쳐 2900만판을 혼자 둔 후에는 세계랭킹 1위 커제 9단을 꺾었던 ‘알파고 마스터’를 상대로 100전89승11패를 거뒀다.

공동저자 중 한 명인 데이비드 실버는 알파고 제로가 기존 버전들보다 강한 이유에 대해 “인간 지식의 한계에 속박되지 않기 때문”이라고 설명했다. 구글 딥마인드는 블로그 글에서 “알파고 제로는 새로운 지식을 발견하고, 통상적이지 않은 전략을 개발하는 한편 새로운 수를 창조했다”고 밝혔다.

<주영재 기자 jyj@kyunghyang.com>

[경향비즈 바로가기], 경향비즈 SNS [페이스북]
[인기 무료만화 보기][카카오 친구맺기]

[©경향신문(www.khan.co.kr), 무단전재 및 재배포 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.