빅데이터 분석은 1월 20일~3월 23일 트위터·인스타그램·유튜브·페이스북·뉴스·커뮤니티·블로그·카페·카카오스토리·네이버 지식인·기업/단체·정부/공공 등 12개 온라인 채널에 게시된 콘텐츠 가운데 총선이나 코로나 등 특정 키워드가 포함된 글들을 분석 대상으로 삼았다. 다만 댓글은 대상에서 제외했다.
두 개의 키워드가 동시에 들어간 콘텐츠의 경우 단어만 포함되고, 내용이 다른 글들을 제외하기 위해 지정된 키워드 외에 15개 이상의 단어가 포함된 글만 정보로 인정했다. 긍정률과 부정률은 인공지능(AI) 시스템을 통해 각 게시글의 개별 단어를 분석, 긍정·부정적 의미의 단어 개수를 분석해 긍정률, 부정률, 중립률로 분류했다. 예를 들어 게시글에 ‘예쁘다’ ‘좋다’ ‘최고’ ‘잘한다’ 등의 단어는 긍정글로, ‘나쁘다’ ‘화난다’ ‘짜증’ ‘못한다’ 등은 부정글로 봤다.
각 정당 호감도 분석은 미래통합당 출범 다음날인 2월 17일을 기준으로 잡았다. 지역구별 후보자 키워드 분석은 2월 17일부터 한 달인 3월 18일까지로, 비교 기간은 그 전 한 달로 했다. 코로나19의 총선 연관성 확인을 위한 분석 기간은 첫 확진자가 발생한 1월 20일부터 3월 18일로, 비교 기간은 2019년 11월 22일부터 2020년 1월 19일로 삼았다.
박재홍 기자 maeno@seoul.co.kr
▶ 밀리터리 인사이드
- 저작권자 ⓒ 서울신문사 -
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.