컨텐츠 바로가기

05.13 (월)

`안물안궁` 통계 해석은 장님 코끼리 만지기

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
매일경제

[사진 제공 = 쉽게 배우는 소프트웨어 공학]

<이미지를 클릭하시면 크게 보실 수 있습니다>


차트는 힘이 세다. 복잡한 숫자들을 일목요연하게 보여주며 대중을 납득시키고 인간 삶에 막대한 영향을 미친다. 대통령 지지율 추이에 따라 국가의 정책이 달라지고, 하루가 멀다 하고 오르락내리락하는 코로나19 일일 확진자 수는 우리가 마음껏 밖에 나가 뛰어놀 수 있는지를 결정한다. 이 밖에도 경제성장률, 실업률 등의 많은 차트들이 일상을 규정한다.

그렇기에 차트는 동시에 위험하다. 의도치 않게 혹은 특정 목적에 따라 차트가 현실을 왜곡해 보여줄 때 이를 바탕으로 한 판단은 필연적으로 파멸적 결과를 낳을 수 있다. 마이애미대 석좌교수 알베르토 카이로는 차트의 위험성을 경고하는 학자 중 대표적 인물이다. 그는 스페인 일간지 '엘문도' 인포그래픽 팀을 이끌며 데이터 시각화 분야의 퓰리처상으로 불리는 국제 인포그래픽을 수상했고, 현재 마이애미대 데이터과학 및 컴퓨팅센터의 시각화 프로그램을 총괄하고 있는 권위자다.

매일경제

카이로는 신간 '숫자는 거짓말을 한다'(원제 How Charts Lie)에서 "그토록 믿어왔던 데이터와 차트도 얼마든지 우리를 속일 수 있다"며 차트를 제대로 읽을 수 있어야 한다고 강조한다. 책은 표와 지도, 막대그래프, 거품 차트 등 160여 개 차트를 보여주며 차트가 우리를 어떻게 속일 수 있는지, 그리고 현상을 있는 그대로 보려면 어떻게 해야 하는지 차근차근 알려준다.

한국 독자들을 위해 쓴 한국어판 서문부터 눈에 띈다. 현직 대통령인 문재인 대통령이 당선된 2017년 제19대 한국 대선 결과를 사례로 든다. 지역별 득표율에 따라 당시 문재인 후보가 가장 우세한 지역을 파란색으로, 홍준표 후보가 가장 우세한 지역을 붉은색으로 표시한 그림만 보면 가히 전자가 압도적이다. 저자는 이러한 해석에 대해 "본래의 목적이 아닌 다른 방향으로 해석하려 하는 것"이라고 경고한다. 또 "안철수 후보는 전국적으로 21%의 지지를 얻었는데 이 지도에 표시조차 되지 않았다"며 "'누가 이겼는가'를 보여주기 위한 목적 외 용도로는 적합하지 않은 차트"라고 강조한다.

지구의 평균 기온 변화를 나타낸 그래프도 정파적 입장에 따라 같은 현상이 어떻게 달리 해석될 수 있는지 보여주는 대표적 사례다. 가로축을 1880년에서 2012년까지의 연도로, 세로축을 화씨 0도에서 100도까지의 온도로 잡으면 최근 100여 년 동안 기온 변화가 극히 미미해 보인다. 환경 보호보다 경제 발전을 중시하는 이들이 좋아하는 차트다. 반면 세로축 단위를 줄여 화씨 56도에서 59도까지의 온도로 잡으면 지구 온도의 장기적 상승 추세가 확연히 드러난다. 이 경우 후자가 올바른 차트다. 지구 기온이 1도 오르느냐 내리느냐에 따라 해수면이 60m나 상승할 수도, 아니면 빙하기가 다시 올 수도 있기 때문이다.

코로나19 상황에서 차트의 중요성은 더욱 커졌다. 올해 3월 워싱턴포스트가 자사 웹 사이트에 게시한 인포그래픽이 대표적이다. 정부가 코로나19와 관련해 아무런 조치도 취하지 않을 경우부터 사회적 거리 두기에 이르는 다양한 통제를 시행했을 때 확진자 수가 얼마나 달라지는지 명확하게 보여주는 차트였다. 이 차트는 순식간에 웹 사이트에서 많은 기사들을 제치고 가장 많은 조회 수를 기록했다. 결과적으로 코로나19에 대한 경각심을 불러일으키는 데 그 어느 기사보다 큰 기여를 했다는 평가를 받았다.

[서정원 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.