유포자의 표현 습관까지 반영해 탐지한 연구 성과 발표
신종 코로나 가짜뉴스 확산…지자체 "엄정대응" (CG) |
(서울=연합뉴스) 이정현 기자 = '합성곱 신경망'을 활용해 뉴스 문맥부터 유포자의 감성 변화 패턴까지 추출해 가짜뉴스 여부를 탐지한 연구 결과가 나와 주목받고 있다.
28일 손진곤 한국방송통신대 컴퓨터과학과 교수 등이 정보처리학회논문지에 낸 'CNN 기반 감성 변화 패턴을 이용한 가짜뉴스 탐지'에 따르면 합성곱 신경망(Convolutional Neural Network·CNN) 활용 시 기존보다 가짜뉴스 탐지 정확도를 높일 수 있다.
합성곱 신경망이란 필터링 기법을 인공신경망에 적용해 이미지를 효과적으로 처리할 수 있는 심층 신경망 기법이다.
기존 딥러닝 연구는 기사의 어휘, 제목과 부제, 리드, 본문 등을 주요 분석 대상으로 해 가짜뉴스에서 공통적인 특성을 추출했고 부가적으로 언론사, 기자, 날짜, 확산 경로, 네트워크 트래픽 등의 메타 데이터를 참고해왔다.
그러나 이 데이터들은 내용 일부를 쉽게 수정할 수 있어 다량의 데이터를 분석한 모델이라 해도 높은 탐지 정확도를 장기간 유지하기는 어려웠다.
연구진은 합성곱 신경망을 이용하면 가짜뉴스의 문맥적 특성을 분석하고 장단기 메모리(장기적 의존 관계 학습을 위한 딥 러닝 모델)를 활용해 감성 변화 패턴을 추출할 수 있다고 설명했다.
감성 변화 패턴은 등장 순서에 의존적인 문장 성분별 감성 점수를 계산하며 가짜뉴스 유포자의 성격, 환경, 교육 및 가짜뉴스를 작성할 때 보이는 표현 습관까지 반영한다.
연구진은 두 가지 가짜뉴스 탐지 모델을 설계했다.
연구진은 '미국, 영국 질병청에 보고된 백신 부작용 중증 사망자가 코로나 사망자 수를 훌쩍 넘기고 있다. 현 상황에서 백신은 답이 아닌 것으로…(파악된다)'라는 가짜뉴스 문장을 만들었다.
이어 '경찰이 무력으로 백신 강제 접종할 수 있다. 문을 부수는 영상과 함께 한국에서도 경찰력을 동원한 백신 강제 접종이 이뤄질 것이라고…(전망된다)'라는 가짜뉴스 모델도 제시했다.
연구진은 이 두 가지 가짜뉴스를 문장 단위로 쪼개고, 쪼갠 단어와 문장을 대상으로 감성 분석을 적용해 감성 점수를 할당한 후 장단기 메모리를 사용했다. 마지막으로 문맥 정보와 감성 변화 패턴을 결합해 뉴스의 사실 여부를 식별했다.
그 결과 서울대 언론정보연구소의 'SNU팩트체크' 데이터 세트를 이용한 비교 실험에서 감성 변화 패턴을 추가로 활용한 제안 모델이 콘텐츠 기반의 전통적 가짜뉴스 탐지 모델과 비교했을 때 성능 면에서 유의미한 개선이 있는 것으로 나타났다.
제안 모델은 감성 변화 패턴을 적용하기 전과 비교해 재현율이 29.2% 향상된 것으로 확인됐으며, 이는 가짜뉴스 탐지 모델의 임곗값을 낮추는 방향으로 영향을 주고 있음을 의미한다고 연구진은 설명했다.
사실이 확인된 뉴스를 가짜뉴스라고 잘못 예측했을 때보다 가짜뉴스를 진짜라고 판단하는 경우의 위험이 상대적으로 큰 현실을 고려했을 때, 감성 변화 패턴을 적용한 제안 모델은 가짜뉴스 근절이라는 목적에 한층 더 부합한다고 볼 수 있다는 것이다.
연구진은 "감성 변화 패턴은 뉴스 분석에 감성분석을 활용하는 기존 접근법과 차별화되는 부분으로서 뉴스를 긍정 또는 부정으로 단순하게 분류하지 않고, 감성이 문장 단위에 따라 어떻게 변화하는지를 분석한다"고 설명했다.
lisa@yna.co.kr
▶제보는 카카오톡 okjebo
▶연합뉴스 앱 지금 바로 다운받기~
▶네이버 연합뉴스 채널 구독하기
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.