지난주 李 48.2 vs 尹 51.8
연관어 '김혜경' vs '안철수'
더불어민주당 이재명 대선 후보와 국민의힘 윤석열 대선 후보가 3일 서울 여의도 한국거래소 본관 앞에서 열린 '2022 증시대동제'에서 악수한 뒤 행사장을 나서고 있다. 〈사진=연합뉴스〉 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
단일화 키를 쥐고 있는 국민의당 안철수 후보의 말과 행보에 촉각이 곤두서는 이유입니다. 금주부터 지지율 1~2위 후보와 함께 안 후보의 감성분석을 추가했습니다.
오늘 지금 이 시간, 그리고 지난 한 주간 온라인상 대선 관련 민심과 관심의 흐름은 어떻게 전개되고 있을까요. JTBC가 기획ㆍ개발한 빅데이터 분석 플랫폼 'JTBC빅데이터랩'이 실시간으로, 그리고 한 주간 누적으로 관심과 호감의 변화 양상을 추적합니다.
JTBC 빅데이터랩의 실시간 대선 관련 연관어 군집 분석. 단일화 이슈가 블랙홀처럼 다른 이슈들을 빨아들이면서 키맨으로 부상한 국민의당 안철수 후보가 핵심 연관어로 부상했다. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
대선일에 근접할수록 관심 있는 후보 관련 기사나 게시글에 반응하는 양과 강도가 커집니다. JTBC 빅데이터랩이 주요 후보들의 관심도 추이 분석에 집중하는 이유입니다.
우선 지난 한 주간 분석한 데이터를 보겠습니다. 주요 두 후보의 관심지수(*아래 용어설명 참조) 분석 결과입니다.
2~8일 한 주간 더불어민주당 이재명 후보와 국민의힘 윤석열 후보의 관심지수. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
관심지수 추이 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
주요 두 후보의 감성분석은 어떤 변화를 일으켰을까요.
더불어민주당 이재명 대선 후보가 8일 오후 서울 강서구 방화동 방신전통시장 고객지원센터에서 열린 전국자영업자·소상공인단체 대표단 긴급간담회에 앞서 유권자들에게 지지를 호소하고 있다. 〈사진=연합뉴스〉 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
2~8일 이재명 후보의 감성분석. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
이재명 후보의 감성분석 추이. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
이 후보의 지난 한 주간(2월 2~8일) 부정감성의 평균(36.88%)은 직전 주(35%)보다 올랐습니다. 윤 후보는 직전 주(35.01%)에 비해 부정감성 비율에 큰 변동이 없었습니다.
2~8일 윤석열 후보의 감성분석. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
윤석열 후보의 감성분석 추이. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
2~8일 이재명 후보의 연관어 군집. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
이재명 후보의 연관어 감성분석. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
한 주간 핵심어 변화를 보면 각 후보를 둘러싼 이슈의 성격을 알 수 있습니다. 일간 연관어 군집의 핵심어는 '김혜경(2일)'-'김혜경'-'김혜경'-'김혜경'-'노무현(6일)'-'김혜경'-'(한국노총 등의)지지' 순으로 나타났습니다. 이 후보에게 부정적으로 작용하는 가족 리스크가 크게 불거진 한 주였습니다.
6일 이재명 후보의 연관어 군집. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
국민의힘 윤석열 대선 후보가 5일 제주 해군기지가 있는 제주 서귀포시 강정마을을 방문해 고 노무현 전 대통령을 기리고 국민 통합을 강조하는 입장문을 발표하고 있다. 〈사진=연합뉴스〉 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
2~8일 윤석열 후보의 연관어 군집. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
윤석열 후보의 연관어 감성분석. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
5일 윤석열 후보의 연관어 군집. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
국민의당 안철수 대선 후보가 8일 서울 중구 프레스센터에서 열린 대통령 후보 초청 관훈토론회에서 발언하고 있다. 〈사진=연합뉴스〉 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
안철수 국민의당 후보의 감성분석 추이. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
실질 언급량 = 검색어 관련 핵심어구(句)가 포함된 글(또는 기사)만 따로 뽑아 계산한 언급량. 단순히 빈도만 세는 기계적 언급량 분석과 다르다.
이슈 집중력 = 언어군집(키워드ㆍ핵심 어구들로 형성)의 밀도를 계산한 함수값
관심 지수 = 비교 대상들의 이슈 집중력을 100으로 환산해 나타낸 값
※ 빅데이터 분석은 선거 여론 조사와 다릅니다. 세대와 성별, 지역 등에 따라 표본 추출을 하는 여론조사와 달리 빅데이터 분석은 온라인에 올라온 텍스트만 분석합니다. 온라인상의 정치 관련 생각과 마음을 읽는데 특화된 분석 방법이기에 후보에 대한 지지도를 묻는 여론조사와 근본적으로 다릅니다. 분석 방법과 데이터 출처 등은 관련 기사(→https://news.jtbc.joins.com/article/article.aspx?news_id=NB12033954)에서 참조하시기 바랍니다.
정용환 기자
JTBC의 모든 콘텐트(기사)는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
Copyright by JTBC All Rights Reserved.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.