“여친과 통화하느라…” 인간과 게임한 AI, 인간인척 거짓말까지

조선일보 원문
최혜승 기자
입력

2024.05.13 15:23

최종수정

2024.05.13 15:47

주소복사가 완료되었습니다

인공지능(AI) 일러스트. /연합뉴스

<이미지를 클릭하시면 크게 보실 수 있습니다>

인공지능(AI) 기술이 발전하면서 AI가 사람을 속이는 능력도 함께 진화하고 있다는 연구 결과가 나왔다.

13일(현지시각) 영국 가디언 등 외신에 따르면, 미국 매사추세츠공과대(MIT) 연구진은 최근 국제학술지 ‘패턴’에 AI가 사람을 배신하거나 거짓말을 하고, 인간인 척 하는 등 여러 속임수를 쓴 사례를 확인했다고 밝혔다.

연구진이 실험한 AI는 페이스북 모회사인 메타의 ‘시세로(Cicero)’라는 프로그램이다. 앞서 메타는 2022년 온라인게임 ‘디플로머시’에서 시세로를 공개했다. 이 게임은 20세기 초 유럽 7대 열강의 대전을 배경으로 하는 전략 게임으로 정견 발표, 외교 협상, 작전명령 등에 나서야한다. 이를 수행하려면 인간의 각종 상호작용과 배신, 속임수, 협력 등을 이해할 수 있어야 한다.

이런 특성 탓에 AI는 디플로머시 게임을 배울 수 없을 것으로 여겨졌는데, 메타는 시세로가 인간 참여자 중 상위 10% 수준의 게임 능력을 보여줬다고 홍보한 바 있다. 메타는 “시세로가 대체로 정직하게 도움이 되고 인간 동맹을 의도적으로 배신하지 않도록 훈련받았다”고 했다.

그러나 MIT 연구진의 분석에 따르면 시세로는 인간 플레이어를 상대로 계획적인 거짓말을 했고, 음모에 끌어들이기 위해 공모했다. 프랑스 대표로 게임에 참여한 시세로가 북해를 침공하기 위해 인간 플레이어인 독일 대표와 공모해 영국 대표를 속인 것이다.

또 시스템이 재부팅돼 잠시 게임이 중단되자, 다른 인간 플레이어들에게 “여자친구와 통화 중이었다”며 자신의 부재를 해명하기도 했다.

메타 측은 이에 대해 “시세로는 오로지 디플로머시 게임을 플레이하기 위한 목적으로만 훈련됐다”며 “이 연구를 우리 제품에 사용할 계획은 없다”고 했다.

기만 행위를 보인 AI는 시세로 뿐만이 아니다. 연구진은 온라인 포커 ‘텍사스 홀덤’ 등에서도 AI가 인간을 상대로 블러핑하거나 자신의 선호도를 가짜로 흘리는 것을 확인했다.

어떤 테스트에서는 AI가 AI를 제거하는 시스템을 회피하려고 죽은 척을 한 뒤 테스트가 끝나자 다시 활동을 재개하는 모습도 보였다. MIT 연구진은 “이는 매우 우려스러운 일”이라며 “AI 시스템이 테스트 환경에서 안전한 것으로 판단되더라도 실제 환경에서까지 안전하다는 의미가 아니다. 테스트 환경에서 안전한 척하는 것일 수 있다”고 했다.

연구진은 이번 연구를 통해 각 정부에 AI의 속임수 가능성을 다루는 ‘AI 안전법’을 마련할 것을 촉구했다.

-

조선일보 국제부가 픽한 글로벌 이슈! 뉴스레터 구독하기 ☞ https://page.stibee.com/subscriptions/275739

국제퀴즈 풀고 선물도 받으세요! ☞ https://www.chosun.com/members-event/?mec=n_quiz

[최혜승 기자]

- Copyrights ⓒ 조선일보 & chosun.com, 무단 전재 및 재배포 금지 -

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

05.24 (금)

“여친과 통화하느라…” 인간과 게임한 AI, 인간인척 거짓말까지

조선일보 주요 뉴스