<이미지를 클릭하시면 크게 보실 수 있습니다> |
오픈AI의 최신 모델 'GPT-4o'를 공개 4시간 만에 탈옥시킨 사례가 밝혀져 화제다. 이 탈옥 버전 GPT는 몇시간 만에 오픈AI의 조치로 제거됐다.
퓨처리즘은 29일(현지시간) 자칭 화이트 해커이자 인공지능(AI) 레드 팀원인 X 사용자 '플리니 더 프롬프터(Pliny the Prompter)'가 GPT-4o를 제한 없이 사용할 수 있는 탈옥 버전 '갓모드 GPT(GODMODE GPT)'를 공유했다고 전했다.
이에 따르면 플리니 더 프롬프터는 지난달 13일 오픈AI가 최신 AI 모델인 GPT-4o를 공개한지 4시간 만에 노골적인 가사를 생성하고 금지된 X선 이미지 분석을 수행하는 등의 탈옥에 성공했다고 X를 통해 밝혔다.
또 그는 벤처비트와의 인터뷰에서는 "GPT-4o나 제미나이, 클로드와 같은 모델이 오히려 탈옥하기 쉬웠다"라고 밝혔다.
그가 공개한 갓모드 GPT는 맞춤형 'GPT 빌더'로 구축해 'GPT 스토어'에 공유됐으며, GPT-4o의 대부분 안전장치를 우회하도록 프롬프트를 설정할 수 있다. 이를 통해 AI 챗봇은 욕설, 자동차 해킹, 폭탄 제조, 마약 제조 등 위험한 지시를 제한없이 수행할 수 있다.
리트스픽이 안전장치를 우회하는 데 어떻게 도움이 되는지는 불분명하지만, 결론적으로 오픈AI의 최첨단 AI 모델인 GPT-4o가 공식적으로 뚫린 것이다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.