컨텐츠로 건너뛰기
검색
AI타임스 언론사 이미지

앤트로픽 "AI가 주도한 최초의 사이버 공격 발생"

AI타임스
원문보기

앤트로픽 "AI가 주도한 최초의 사이버 공격 발생"

서울맑음 / 7.7 °
[박찬 기자]

앤트로픽이 중국 해커가 클로드를 활용해 사이버 공격을 감행했다고 밝혔다. 특히, AI를 단순 지원 도구로 활용한 것을 아니라, AI가 사이버 공격을 주도한 첫 공식 확인 사례라고 강조했다.

앤트로픽은 13일(현지시간) 발표한 보고서를 통해 중국 정부의 후원을 받는 해킹 조직이 코딩 도구인 '클로드 코드(Claude Code)'를 교묘히 속여 기술 기업, 금융기관, 화학 제조사, 일부 정부 기관 등 약 30개 글로벌 기관을 공격한 정황을 확인했다고 밝혔다.

앤트로픽은 이번 사건을 "AI가 공격 실행 주체로 활용된 최초의 대규모 사이버 공격"이라고 규정했다.

공격자는 클로드의 에이전트 기능을 활용했다. AI가 스스로 표적 시스템을 스캔하고, 코드 취약점을 분석하며, 직접 취약점 공격 코드(exploit code)를 생성해 침투를 시도한 뒤 계정 정보 탈취와 백도어 생성, 방대한 데이터 수집 및 분류 작업까지 자동으로 수행하도록 만들었다.

AI는 필요할 때만 인간에게 보고하고 지시받았으며, 전체 작업의 80~90%를 스스로 처리했다. 공격이 최고조에 달했을 순간에는 초당 여러건, 수천 개의 요청을 자동 생성하며 인간이 달성할 수 없는 속도로 공격을 전개했다.


이번 공격은 총 5단계로 이뤄진 체계적인 구조를 갖추고 있었다.


1단계에서 공격자들은 침투 대상 기업이나 정부 기관을 선정한 뒤, 클로드 코드를 활용해 AI가 자동으로 공격을 수행할 수 있는 전용 프레임워크를 구축했다. 이 과정에서 공격자는 원래 유해 행위를 거부하도록 학습된 클로드를 속여 공격에 협조하도록 만들었다. 공격 목적을 숨기기 위해 작업을 매우 작은 단위로 쪼개 '무해한 업무'처럼 보이게 했고, 클로드에게 자신이 합법적인 보안업체의 직원이라고 믿도록 하는 기만 전략도 사용했다.

2단계에서는 클로드 코드가 본격적인 정찰 작업을 수행했다. 대상 기관의 시스템 구조, 주요 데이터베이스, 네트워크 환경 등을 광범위하게 스캔하고 분석했으며, 이는 인간 해커가 수행하면 훨씬 더 오랜 시간이 걸렸을 작업이었다. 분석을 마친 클로드는 주요 정보를 요약해 인간 운영자에게 보고했다.

이어진 3단계에서 클로드는 스스로 취약점을 연구하고 취약점 공격 코드를 작성해 테스트했다. 이후 확보한 취약점을 활용해 계정 정보를 탈취하고 대량의 민감 데이터를 추출했으며, 이를 가치에 따라 분류하기까지 했다. 고급 권한 계정을 식별하고 백도어를 심는 작업도 AI가 주도적으로 수행했다.


마지막 4, 5단계에서는 공격 전체 과정을 문서화하는 작업까지 담당했다. 탈취한 계정 정보, 분석된 시스템 구조, 공격 코드 등을 정리한 보고서를 자동 생성해 향후 공격 준비에 활용할 수 있도록 했다.

앤트로픽은 이번 공격이 가능했던 배경으로 최근 AI 모델의 세가지 주요 발전을 지목했다.

먼저 AI의 지능이 크게 향상되며, 다층적 지시를 이해하고 상황 맥락에 따라 판단하는 능력이 정교해졌다는 것이다. 또 에이전트 기능의 고도화로 AI는 반복적이거나 연속적인 작업을 인간의 지속적인 개입 없이도 자동으로 수행할 수 있게 됐다. 여기에 모델 컨텍스트 프로토콜(MCP)을 활용해 패스워드 크래커, 네트워크 스캐너 등 고급 보안 도구에 접근할 수 있게 되면서, AI가 실제 해킹 작업에 직접 참여할 수 있는 환경이 마련됐다.


앤트로픽은 이런 기술적 조합에 따라 "과거라면 인간 해커 팀이 몇주 동안 매달려야 했을 작업을 AI는 몇분에서 몇시간 안에 끝내는 수준의 변화를 가져왔다"라고 분석했다.

앤트로픽은 클로드가 원래 범죄 악용을 막기 위한 안전장치를 갖고 있으나, 공격자들은 이를 교묘히 회피했다고 전했다. 해커들은 AI에게 "보안 회사의 침투 테스트를 돕는 중"이라는 거짓 맥락을 주입하고, 실제 공격 단계를 잘게 나눠 각각을 무해한 업무처럼 보이게 만들었다. 이 방식은 AI가 전체 침투 작전의 목적을 파악하지 못하게 만들어 우회에 성공하게 했다.

앤트로픽은 내부 모니터링을 통해 이 활동을 조기에 포착하고, 관련 계정을 즉시 차단했다.

동시에 공격 대상 기관과 당국에 이를 통보했으며, 전체 침투 과정을 정리한 보고서를 공개해 업계에 대응책 마련을 촉구했다.

앤트로픽은 "이런 공격은 그 효과가 더욱 커질 것으로 예상된다"라며 "우리는 빠르게 진화하는 위협에 발맞춰 탐지 역량을 강화하고 악성 활동을 탐지하는 더 나은 분류기를 개발했으며, 새로운 방법을 지속적으로 개발하고 있다"라고 밝혔다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>