컨텐츠 바로가기

04.20 (토)

'동상이몽' 대선후보의 뇌 구조···많이 쓴 단어 살펴보니

댓글 4
주소복사가 완료되었습니다
선거는 상대평가다. 여러 후보 가운데 가치관·신념 등이 나와 ‘가장 가까운’ 후보를 뽑게 된다. 그러자면 후보 간 비교가 필수다. 중앙일보는 주요 대선 후보 5인의 발언 169건 2만8000여 단어를 분석해 후보별 특징을 비교했다. JTBC가 최순실 씨 태블릿PC에 대해 처음 보도한 2016년 10월 24일부터 기자협회주관 TV토론이 있었던 지난 13일 사이 발언을 대상으로 삼았다. 분석은 소셜네트워크분석(SNA) 전문기업 사이람, 커뮤니케이션 전문기업 도모브로더의 도움을 받았다.

☞어떻게 분석했나

후보들의 연설·발언을 문단 단위로 쪼갠 뒤 단어를 추출했다. 이어 컴퓨터 알고리즘을 이용해 단어들을 비슷한 주제끼리 그룹으로 묶었다. 기계학습(머신러닝)의 하나인 토픽모델링 기법이다. 그렇게 묶은 주제별로 각 후보가 사용한 단어의 빈도를 측정해 비교했다. 비교에는 연결망 분석 방법이 쓰였다. 후보들이 사용한 주요 단어를 원으로 표시하고, 후보들과 선으로 연결했다. 해당 단어를 자주 사용했을수록 원의 크기가 커지고 연결선이 굵어진다.

중앙일보

<이미지를 클릭하시면 크게 보실 수 있습니다>


"아빠" 강조한 심상정 vs 언급 안 한 홍준표
한국의 합계출산율은 1.25명이다(2015년 기준). 경제협력개발기구(OECD) 가입국 중 꼴찌다. 모든 대선후보가 출산 문제에 관심을 쏟는 이유다. 하지만 접근법은 후보마다 제각각 달랐다.

심상정 정의당 후보는 ‘아빠’라는 단어를 가장 많이 사용했다. 대부분의 후보가 ‘여성’이란 단어를 가장 많이 쓴 것과 대조적이다. 심 후보는 육아휴직 기간을 확대하되 반드시 부부가 각각 3개월씩 쓰도록 하는 육아휴직 의무할당제 등 소위 ‘슈퍼우먼 방지법’을 공약했다. 관련 발언에서도 엄마뿐 아니라 아빠를 함께 언급했고, 더 자주 언급했다.

유승민 바른정당 후보는 ‘여성’을 주로 썼지만 ‘부모’와 ‘아빠’라는 단어도 함께 사용했다. 안철수 국민의당 후보는 ‘여성’과 함께 ‘성평등’이란 단어를 비중 있게 썼다.

반면 문재인 더불어민주당 후보는 ‘부모’ ‘아빠’ 같은 단어보다 ‘여성’과 ‘아이’ 같은 단어를 비중 있게 썼다. 홍준표 자유한국당 후보는 저출산 관련 발언 중에 ‘아빠’나 ‘남성’을 아예 언급하지 않았다. 그의 발언에는 ‘국가’ ‘건설’ ‘미래’ 같은 단어가 자주 등장했다. 다른 후보들이 ‘일’ ‘부담’ ‘장시간’ ‘노동’ 같은 단어를 쓴 것과 차이가 났다.

최승호 도모브로더 부대표는 “다른 후보들이 미시적 접근을 한다면 홍 후보는 거시적 접근을 하고 있는 것으로 보인다”고 말했다.

중앙일보

<이미지를 클릭하시면 크게 보실 수 있습니다>


문재인·유승민 광범위하게 발언
권력기관 개혁에 대한 가장 많이 발언을 한 사람은 문재인 후보였다. 언급한 개혁 대상도 다양했다. 다른 후보들은 주로 ‘검찰’에 집중됐지만 문 후보는 ‘검찰’ ‘국가정보원’ ‘청와대’ ‘고위공직자’ ‘총리’ ‘장관’ 등을 고르게 언급했다. ‘기소권’(검찰) ‘사찰’(국정원) ‘인척’ ‘특권’ 등 개혁 대상의 문제점도 구체적으로 언급했다.

문 후보는 이 분야에서 '적폐' '청산' 등의 단어도 사용했다. '적폐 청산'은 이번 선거에서 문 후보가 밀고 있는 핵심 슬로건 중 하나다. 하지만 지난 3월 말 발표한 출마선언문에선 이 단어가 빠졌다. 정치권에선 "문 후보가 의도적으로 ‘적폐청산’이란 단어 사용을 피한다"는 말이 돈다. 이 단어가 주는 '공격성'이 문 후보의 약점이 되기 때문이란 해석이다.

문 후보를 제외하면 의외로 보수인 유승민 후보의 발언의 비중이 컸다. 그는 출마선언문에서 “내가 대통령이 되면 미르ㆍK스포츠 같은 비리, 비선실세 딸의 입학 비리 같은 일이 없을 것”이라며 지난 정권의 실책을 직접 언급하기도 했다.

안철수 후보는 이 분야에서 발언비중이 가장 낮았다. 그가 사용한 관련 단어는 문 후보(407개)의 20분의 1 수준인 17개에 불과했다.

중앙일보

<이미지를 클릭하시면 크게 보실 수 있습니다>


문재인의 '정부' vs 안철수의 '민간'
문재인 후보가 ‘적폐청산’ 담론을 주도했다면, 안철수 후보는 4차산업혁명·미래산업 분야에서 도드라졌다.

안 후보는 이 분야에서 총 389개의 단어를 사용했다. 특히 ‘교육’ ‘학제개편’ 같은 단어를 함께 쓰며 ‘4차산업혁명을 위한 교육 개혁’을 강조했다.

재미있는 것은 이 분야에서 안철수 후보와 유승민 후보, 문재인 후보와 심상정 후보의 발언이 공통점을 보였다는 사실이다. 문 후보와 심 후보는 ‘정부’라는 단어를 중요하게 사용했다. 반면 안 후보와 유 후보는 ‘민간’ ‘기업’ 같은 단어를 비중 있게 썼다. 같은 4차산업혁명을 말하지만 그 주체에 대한 생각은 후보별로 다르다는 사실을 보여주는 대목이다.

중앙일보

단어연결망

<이미지를 클릭하시면 크게 보실 수 있습니다>


문재인·안철수, 비슷한 어휘 사용
외교·안보 분야에선 예상대로 보수 후보들의 발언 비중이 높았다.

홍준표 후보는 대부분의 주제에서 상대적으로 발언량이 많지 않았지만 이 분야에서만은 달랐다. 특히 ‘핵’ ‘북핵’ 같이 위기를 강조하는 단어를 많이 썼다. 한반도 내 전술적 핵무기 배치를 주요 공약으로 내세운 후보다웠다. ‘미국’이란 단어는 중요하게 사용했지만 ‘중국’은 언급하지 않은 것도 특징이었다.

같은 보수 성향의 유승민 후보의 발언도 홍 후보와 비슷했다. 하지만 홍 후보와 달리 ‘중국’ ‘설득’ ‘협력’ 같은 단어를 사용했다는 점에서는 차이를 보였다.

안철수 후보는 ‘우클릭’ 행보 중임에도 ‘한미동맹’ ‘중국’ ‘평화’ ‘관계’ 같은 단어를 고르게 사용하며, 보수 후보들보다는 문 후보와 가까운 모습을 보였다.

중앙일보

단어연결망

<이미지를 클릭하시면 크게 보실 수 있습니다>


홍준표만 '강성노조' 딴소리
요즘 청년들은 일자리와 함께 연애ㆍ결혼을 포기한 소위 ‘삼포세대’라고 불린다. 이들에 대한 대선 후보들의 발언은 뚜렷한 시각 차를 보였다.

문재인ㆍ유승민ㆍ심상정 후보는 청년 문제를 ‘실업’ 뿐 아니라 ‘주택’ ‘등록금’ ‘보육’ 등 다양한 관점으로 바라봤다. 더불어 ‘금리’ ‘상환’ ‘취업’ ‘일자리’ 같은 해결책을 함께 언급했다. 가장 많은 단어를 사용한 사람은 상속ㆍ증여세 약 5조원을 20세 청년들에게 나눠주는 ‘사회상속제’를 공약한 심 후보였다.

반면 안철수 후보의 이 분야 핵심 키워드는 ‘실업’이었다. 이와 함께 ‘중소기업’ ‘대우’ 같은 단어도 함께 사용했다. 안 후보는 중소기업 취업 청년에게 2년 간 정부가 1200만원을 한시적으로 지원하겠다고 공약했다.

홍준표 후보는 다른 후보와 공유하는 단어가 전무했다. 김강민 사이람 상무는 “홍 후보는 청년에 대해 다른 후보와 전혀 다른 문제의식을 가지고 있는 것으로 보인다”고 말했다. 특이하게 눈에 띄는 단어는 ‘강성귀족노조’였다. 청년 실업의 원인을 노조에서 찾고 있는 것이다. 홍 후보는 당 선거 홍보물을 통해 “강성귀족노조와 기업 옥죄기에 집중하는 좌파 정부는 청년들의 고통을 가중시킬 뿐”이라고 주장했다.

기사=정선언 기자 jung.sunean@joongang.co.kr

그래픽=김은교 디자이너

[데이터데이트]데이터로 본 대선후보의 뇌구조① '백화점' 문재인 vs '전문점' 안철수

정선언 기자 jung.sunean@joongang.co.kr

▶SNS에서 만나는 중앙일보 [페이스북] [트위터] [네이버포스트]

ⓒ중앙일보(http://joongang.co.kr) and JTBC Content Hub Co., Ltd. 무단 전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.