KAIST, 국보연과 'AI 생성 댓글' 탐지하는 기술 개발...AI 여론 조작 잡아낸다 : zum 뉴스

생성형 인공지능(AI) 기술 발전으로 이를 악용한 온라인 여론 조작 우려가 커지는 가운데, 우리 연구진이 한국어 AI 생성 댓글을 탐지하는 기술을 개발했다. 길고, 구어체 표현이 많은 한국어 뉴스 댓글에도 적용 가능하다.

한국과학기술원(KAIST·총장 이광형)은 김용대 전기 및전 자공학부 교수팀이 국가보안기술연구소와 협력해, 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다.

AI 댓글 생성 프레임워크 구성

최근 생성형 AI는 뉴스 기사 맥락에 맞춰 감정·논조까지 조절할 수 있으며, 몇 시간 만에 수십만 개 댓글을 자동 생성할 수 있다. 여론 조작에 악용될 수 있다.

오픈AI의 GPT-4o API를 기준으로, 국내 주요 뉴스 플랫폼 하루 평균 댓글 수인 20만 개 생성에 20만 원이면 가능할 정도다. 공개 거대언어모델(LLM)은 자체 그래픽처리장치(GPU) 인프라만 갖추면 사실상 무상으로 댓글을 대량 생성할 수 있다.

연구팀은 14종의 다양한 LLM 활용, 자연스러움 강화, 세밀한 감정 제어, 참조자료를 통한 증강 생성의 네 가지 전략을 적용한 AI 댓글 생성 프레임워크를 개발, 실제 이용자 스타일을 모방한 한국어 AI 생성 댓글 데이터셋을 구축하고 이 중 일부를 벤치마크 데이터셋으로 공개했다.

또 설명 가능한 AI(XAI) 기법을 적용해 언어 표현을 정밀 분석한 결과, AI 생성 댓글에는 사람과 다른 고유한 말투 패턴이 있음을 확인했다.

XDAC 데모. 탐지 및 식별 시연 예시

XDAC는 AI 생성 댓글 탐지에서 98.5% F1 점수로 기존 연구 대비 68% 성능을 향상시켰으며, 댓글 생성 LLM 식별에서도 84.3% F1 성능을 기록했다.

고우영 선임연구원은 “이번 연구는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고, 생성 모델까지 식별할 수 있는 세계 최초 기술”이라며 “AI 기반 여론 조작 대응의 기술적 기반을 마련한 데 큰 의의가 있다”고 강조했다.

연구팀은 XDAC의 탐지 기술이 단순 판별을 넘어 심리적 억제 장치로도 작용할 수 있다고 설명했다. 마치 음주단속, 마약 검사, CCTV 설치 등이 범죄 억제 효과를 가지듯, 정밀 탐지 기술의 존재 자체가 AI 악용 시도를 줄일 수 있다는 것이다.

XDAC는 플랫폼 사업자가 의심스러운 계정이나 조직적 여론 조작 시도를 정밀 감시·대응하는 데 활용될 수 있으며, 향후 실시간 감시 시스템이나 자동 대응 알고리즘으로 확장 가능성이 크다.

이번 연구는 7월 27일부터 개최되는 'ACL 2025' 메인 콘퍼런스에 채택되며 기술력을 인정받았다.

이번 연구는 김용대 교수 지도 아래 국보연 소속이자 KAIST 박사과정인 고우영 선임연구원이 제1 저자로 참여했다. 김형식 성균관대 교수와 오혜연 KAIST 교수가 공동 연구자로 참여했다.

이 기사의 카테고리는 언론사의 분류를 따릅니다.