컨텐츠 바로가기

04.25 (목)

[경제와 세상]빅데이터 시대의 국가통계

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
국가통계의 중요성이 나날이 높아지고 있다. 국가 전반의 의사결정 과정에서 통계자료가 그 어느 때보다 다양하게 활용되고 있기 때문이다. 원래 국가통계의 태동은 다분히 부정적인 목적 아래 시작되었다. 과거 지배층이 피지배층을 대상으로 조세 징수나 징병제 등을 원활히 유지하기 위해 누가, 어디서, 어떠한 상태에 놓여 있는지를 파악하려고 만든 것이 국가통계의 시초였기 때문이다.

경향신문

하지만 오늘날 국가통계는 국가 전반의 정보를 객관적이고 가치중립적인 수치적 자료로 만들어, 사회현상에 대한 공통된 인식을 공유할 수 있는 기회를 제공하고 있다. 국가통계를 통한 공통된 상황 인식은 국가 운영 방향을 논의하는 출발점이 되어 효율적인 의사결정의 기회를 제공해 준다. 현재 많은 국가들은 국가통계의 사회통합 기능과 정책 수립·평가 기능에 주목하며 국가통계의 품질 향상을 위해 제도 개선을 추구하고 있다. 그런데 최근 들어 정보통신기술(ICT) 분야의 발전과 더불어 등장한 빅데이터로 인해 기존 국가통계체계의 실효성에 의문을 갖게 만드는 사례가 다수 등장하기 시작했다. 많은 국가들은 이를 기존 국가통계체계의 위기이자 기회 요인으로 받아들이고 있다.

현재 많은 국가들이 경기 상황을 사전에 예측하기 위해 많은 비용을 투여해 관련 지표를 집계하고 있다. 네덜란드만 하더라도 경기 진단을 위해 매월 1000가구를 추출해 지역 경제 상황, 고용 상태 등에 대한 설문조사를 실시하고 있다. 하지만 이러한 조사 방식은 많은 비용이 투여될 뿐만 아니라 적시성 있는 결과를 얻기도 힘들다. 이에 네덜란드는 사회관계망서비스(SNS) 데이터를 활용해 경제 상황을 예측하기 위한 노력을 해 왔다. 네덜란드는 국민 대부분이 SNS를 사용하고 있다는 사실에 주목해, 2010년 6월부터 2012년 8월까지 SNS상 메시지를 매월 6000만건 수집했다. 해당 기간 전통적인 국가통계지표를 통한 경기 예측 결과와 SNS 메시지를 바탕으로 한 경기 예측 결과가 상당히 유사한 것으로 확인되었다. SNS 메시지를 통한 경기 예측 방식을 보다 정교하게 보완할 경우, 많은 비용을 들이지 않고, 수시로 경기를 예측할 수 있는 지표체계를 갖추게 될지도 모른다.

정부 공식 통계보다 실업률 변동 추이를 먼저 예고한 사례도 있다. 미국의 민간 교통정보기업인 인릭스(Inrix)는 출퇴근 시간대 교통량이 줄어드는 현상을 바탕으로 실업률 증가를 미국 공식 통계보다 먼저 예측한 바 있다. 실제 실직 상태에 놓인 사람들이 실직 바로 다음날 실업수당을 신청하러 가는 것은 아니다. 실제 실직 상태와 실업수당 신청으로 통계에 집계되는 데까지 약간의 시차가 발생할 수 있다. 하지만 실직 상태에 놓이면 바로 다음날부터 출근할 필요가 없기에 교통량은 이를 즉각적으로 반영할 수 있다. 이러한 시차로 인해 인릭스는 미 통계청보다 실업률 변동 추이를 먼저 감지할 수 있었다.

각 국가마다 질병 발생을 통제하고 예방하기 위한 기구와 지표가 존재한다. 미국 역시 CDC라는 질병통제예방센터를 통해 그러한 기능을 수행해 왔다. 하지만 한동안 구글이 CDC보다 질병을 보다 빠르게 예측해 화제가 됐다. 구글은 어느 지역에서 감기 관련 검색이 늘면 얼마 지나지 않아 해당 지역에 독감주의보가 발표되더라는 사실을 확인했다. 이후 구글은 이에 대한 면밀한 연구를 진행해 검색창에 관련 검색어가 입력되는 빈도를 토대로 독감 확산 여부를 포착했으며, CDC보다 2주나 빠르게 식별할 수 있게 되었다고 발표한 바 있다. 이제는 아예 전 세계 독감 확산 현황을 파악할 수 있는 전용 페이지를 만들어 보급하고 있다.

이상의 사례를 통해 다양한 빅데이터를 활용할 경우, 훨씬 저렴하고 빠르게 유의미한 통계자료를 도출할 수 있음을 알 수 있다. 하지만 현재까지 이들 신종 데이터가 국가통계를 완벽하게 대체하지는 못하고 있다. 그것은 국가통계가 갖추어야 할 정확성, 일관성, 국제적 비교 가능성 등의 측면에서 아직까지는 보완해야 할 점이 많기 때문이다. 앞서 언급한 구글 사례의 경우만 하더라도 2009년 신종 인플루엔자(H1N1)의 전 세계적 유행을 놓치고, 2013년에는 실제 독감 발생률의 2배에 달하는 예측치를 내놓아 구글 독감 트렌드의 신뢰도에 문제가 제기된 바 있다.

하지만 분명한 것은 이들 빅데이터 역시 언젠가는 국가통계체계에 포함될 것이라는 사실이다. 이러한 상황에 보다 적극적으로 대응하기 위해서는 기존 국가통계 공적 기관들뿐만 아니라 카드사, 이통사 등 신종 데이터를 확보하고 있는 민간 경제주체들과의 교류 협력도 그 어느 때보다 강화해야 할 것이다.

박정호 | KDI 전문연구원

최신 뉴스두고 두고 읽는 뉴스인기 무료만화

©경향신문(www.khan.co.kr), 무단전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.