컨텐츠 바로가기

04.27 (토)

살인자의 숫자놀음…이젠 속지 않는다 [전문가의 세계 - 이종필의 과학자의 발상법 (9)]

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

심슨과 이춘재

[경향신문]

경향신문

<이미지를 클릭하시면 크게 보실 수 있습니다>


영원히 해결되지 않을 것만 같았던 이른바 ‘화성 연쇄살인사건’의 범인이 작년 9월 극적으로 밝혀졌다. 범인은 무기징역 선고를 받고 교도소에 수감 중이던 이춘재였다. 범인을 이춘재로 특정할 수 있었던 데에는 DNA 검사가 결정적인 역할을 했다.

DNA는 DeoxyriboNucleic Acid(디옥시리보 핵산)의 약자로 생명체의 유전 정보를 담고 있는 물질이다. 마치 줄사다리가 꼬여 있는 듯한 이중나선구조의 형태이다. 줄사다리의 발판에 해당하는 부분이 염기로, 네 종류가 있다. 인간의 DNA에 포함된 염기는 약 30억쌍에 이른다. 염기가 늘어선 순서를 염기서열이라 한다.

보통 시료의 DNA와 특정인 홍길동의 DNA를 비교할 때 염기서열이 반복되는 구간을 살핀다. 사람에 따라 어떤 염기서열이 반복되는 횟수가 다르기 때문에 이런 구간을 여럿 골라서 비교하면 시료의 DNA와 홍길동의 DNA가 일치하는지 확인할 수 있다.

그러나 DNA가 일치한다는 결과가 나왔다고 해서 그것으로 모든 게 끝나는 것은 아니다. 지난 시간에 소개했던 양성예측도의 개념을 떠올려 보면 어떤 질병에 대한 검사 결과 양성으로 나왔을 때 실제 질병에 걸렸을 확률과, 실제 질병에 걸렸을 때 양성으로 판정될 확률은 일반적으로 같지 않다. 범죄 현장에도 같은 논리를 적용해 보자면, 현장 증거물에서 홍길동의 DNA와 일치하는 DNA가 나왔을 때 홍길동이 범인일 확률과, 홍길동이 범인일 때 증거물의 DNA가 일치할 확률은 다르다.

경향신문

<이미지를 클릭하시면 크게 보실 수 있습니다>


현장 증거물 DNA와 일치하는
DNA가 나왔을 때 범인일 확률과,
범인과 그 증거물의 DNA가
일치할 확률은 달라

만약 홍길동이 범인이라면, 증거물에서 나온 DNA는 홍길동의 DNA와 일치할 것이다. 이때 현재의 DNA 분석기술 수준에서 증거물의 DNA가 홍길동의 DNA임에도 불구하고 서로 불일치하는 것으로 결과가 나올 확률은 0이다. 이는 바이러스 검사에서 바이러스에 감염되었음에도 진단키트가 음성으로 판정하는 위음성의 확률이 0인 경우와 같다. 따라서 이때는 검사 결과 100%의 확률로 DNA 일치 판정이 나온다. 즉 DNA 검사의 민감도는 100%이다. 한마디로 말해, 범인이 남긴 DNA는 반드시 범인의 DNA로 판정된다. 물론 일란성 쌍둥이를 포함해 우연히도 범인과 같은 유전자를 가진 극히 드문 경우도 있다. 이 경우 서로 다른 염기서열을 같다고 판정한 것이 아니므로 검사 자체에는 문제가 없다. 편의상 이처럼 극히 드문 경우는 논외로 하자.

한편 범인이 아닌 다른 사람의 DNA를 범인의 DNA로 잘못 판정할 확률은 예전에 10만분의 1~100만분의 1 정도였다. 이는 바이러스가 없음에도 진단키트가 양성으로 판정하는 위양성의 경우에 해당한다. 만약 DNA를 잘못 판정할 확률이 10만분의 1, 즉 0.001%라면, 해당 유전자가 없을 때 DNA가 일치하지 않는다고 올바르게 판정할 확률은 99.999%이다. 보통 DNA 검사의 정확도를 말할 때 나오는 숫자가 이 값으로, 감염병 진단에서 특이도라 부르는 값이다.

이제 현실의 문제, 즉 증거물의 DNA와 일치하는 홍길동을 붙잡았을 때 홍길동이 범인일 확률은 얼마일까? 이는 감염병 진단에서 양성예측도에 해당하는 확률이다. 예를 들어 DNA 검사의 특이도를 99.999%라 하면 증거물에서 나온 DNA와 무죄인 사람의 DNA가 일치한다고 판정할 확률이 10만분의 1(0.001%)이다.

만약 홍길동에 대한 재판에서 이런 DNA 증거가 나왔을 때, 홍길동을 기소한 검사와 홍길동을 변호하는 변호인은 어떻게 대응할까? 아마도 검사는 이렇게 말할 것이다. “홍길동이 무죄임에도 DNA 판정이 잘못될 확률이 10만분의 1이니까 99.999%의 확률로 홍길동이 범인입니다.”

홍길동의 변호인은 검사의 말이 채 끝나기도 전에 이의를 제기하며 이렇게 주장할 것이다. “이 숫자 자체는 굉장히 작지만 확률이 아주 작더라도 시행 횟수가 커지면 실제 일어나는 사건은 많을 수 있습니다. 무죄임에도 DNA가 일치한다고 잘못 판정할 확률이 10만분의 1이니까, 대한민국 5000만 인구 중에 무려 500명이나 잘못된 판정의 희생자가 될 수 있습니다. 따라서 홍길동이 범인일 확률은 500분의 1, 즉 0.2%에 불과합니다. 따라서 99.8%의 확률로 홍길동은 무죄입니다.”

누구의 말이 맞을까? 먼저 검사의 주장은 특이도와 양성예측도를 구분하지 못한, 또는 일부러 안 한 결과이다. 중요한 것은 DNA가 일치할 때 홍길동이 범인일 조건부 확률이다. 이를 ‘기소자의 오류(prosecutor’s fallacy)’라고 한다. 그렇다면 변호인의 주장이 옳을까?

만약 연쇄살인사건과 관련된 아무런 정보가 없다면 대한민국 인구 전체를 용의자로 볼 수도 있다. 그러나 설령 전 국민이 용의자라 하더라도 홍길동이 범인일 확률은 5000만분의 1에서 500분의 1로 급격히 상승한 셈이다.

또한 현실에서는 수사를 통해 여러 정보들이 결합되고 용의자의 범위가 상당히 줄어든다. 무죄임에도 DNA가 일치한다고 잘못 판정될 피해자가 당연히 생길 수는 있으나 그 대상이 대한민국 전체 인구일 필요는 없다. 범행의 성격에 따라 어린이나 노약자는 제외될 가능성이 많고 특정 연령대로 제한될 수도 있다. ‘이춘재 사건’의 경우 사건 당시 수사 용의선상에 오른 사람이 2만여명, 지문검사를 한 사람이 4만여명이었다고 한다. 범위를 좀 더 넓혀 사건이 일어난 화성시 전체를 대상으로 하더라도 당시의 인구는 20만명이 채 되지 않았다. 만약 경찰이 수사정보를 바탕으로 범인은 반드시 화성시에 살고 있다고 확신할 수 있다면 DNA 검사가 필요한 대상은 5000만명에서 20만명 정도로 줄어든다. 이 중에서 범인이 아님에도 DNA 검사가 일치한다고 잘못 판정되는 사람은 확률적으로 단 두 명이다. 이처럼 변호인이 특정 증거나 다른 수사정보의 유효함을 무시하는 경향을 ‘피고 변호인의 오류(defense attorney’s fallacy)’, 또는 ‘피고의 오류(defendant’s fallacy)’라 한다.

경향신문

미식축구선수 출신의 영화배우 OJ 심슨


실제 현실에서도 위와 비슷한 논쟁이 있었다. 1990년대 전 세계를 떠들썩하게 했던 ‘O J 심슨 사건’이 바로 그것이다. 전설적인 미식축구 선수였던 심슨은 1994년 미국 로스앤젤레스의 한 저택에서 일어난 끔찍한 살인사건의 범인으로 지목돼 기소됐다. 피해자는 심슨의 전 부인과 그녀의 남자친구였다. 사건 현장의 모든 증거는 심슨을 가리키고 있었다.

현장에서 검출된 “산더미 같은” 108개의 DNA 증거는 심슨의 DNA와 일치하는 것으로 판명됐다. 이에 맞서 심슨의 초호화 드림팀 변호인단은 DNA 증거가 대부분 오염되었거나 경찰에 의해 조작되었다는 주장을 폈다. 검찰 측에서는 현장에서 발견된 혈액이 심슨의 혈액과 일치했고 이는 400분의 1의 확률에 해당한다고 주장했다. 심슨의 변호인단은 그 정도 확률이라면 로스앤젤레스 인구 중에 같은 피를 가진 사람들로 미식축구 경기장을 가득 채울 것이라고 맞섰다.

이런 논란을 잠재우려면 검사의 정확도를 높이면 된다. 정확도가 올라가면 무고한 사람의 DNA가 증거물의 DNA와 일치하지 않는다고 옳게 판정할 확률이 높아지므로 그 반대로 판정할 확률은 낮아진다. 만약 이 숫자가 10만분의 1에서 100만분의 1로 낮아지면 인구 20만명 중에 0.2명만이 범인으로 잘못 판정될 것이므로 홍길동이 범인일 확률은 1/1.2=83%로 높아진다. 오판할 확률이 1000만분의 1로 떨어지면 홍길동이 범인일 확률은 98%까지 올라간다. 각 DNA에서 비교하는 염기서열의 개수가 많아질수록 정확도가 높아질 것이다. 심슨 사건이 발생한 1994년은 미국에서도 DNA 분석기법이 수사에 활용된 초기였고 그 정확도는 약 1만분의 1에 불과했다.

정확도를 높이는 것이 과학자들의 역할이라면 경찰은 용의자 범위를 최대한 줄여야 한다. 한 도시 인구 전체가 용의자라면 경찰은 사실상 아무런 수사도 하지 않았다는 얘기일 것이다.

요즘은 10억분의 1g만 있어도
중합효소연쇄반응이라는
증폭기술을 이용해
DNA 분석 가능해져

이춘재 사건 해결,
경찰의 집념이 첨단과학과 만나
기적과도 같은 성과를 낸 셈

실제로 이춘재를 연쇄살인의 범인으로 특정할 수 있었던 것은 사건 증거물에서 새로 추출한 DNA를 수감자의 DNA 자료와 대조한 결과였다. 당국에서 운용하는 DNA 데이터베이스는 수감자와 구속 피의자 등 약 22만명이라고 하니 숫자로만 보자면 당시 화성시 인구와 비슷한 규모이다.

만약 DNA 분석이 잘못될 확률이 10만분의 1이라 하고 20만회에 걸쳐 분석을 시행했다면 누군가는 DNA가 일치한다는 (잘못된) 결과가 나올 수밖에 없을 것이다. 이춘재 사건의 경우 오랜 세월 미제사건으로 남아 있었으니까 그렇게라도 DNA 대조를 할 수밖에 없었을 것이다.

다행히도 한국의 DNA 분석기술이 세계 최고 수준이라 수많은 검사 횟수에서 비롯되는 약점을 커버하고도 남을 만큼 정확도를 크게 향상시켰다. 언론 보도에 따르면 이춘재 사건의 경우 이춘재의 DNA와 실제로 일치하지 않을 확률이 10의 23제곱분의 1에 달한다고 한다. 이렇게 향상된 이유는 염기서열을 비교하는 부위가 예전 3~4개에서 최근 20개로 대폭 늘어났기 때문이다. 10의 23제곱이면 지난번 다루었던 아보가드로수에 맞먹는 숫자이다. 세계 인구를 100억명으로 잡으면 세계 인구 전체에 대해서도 10의 13제곱, 즉 10조분의 1명이 무고하게 범인으로 지목될 것이다. 이 경우 DNA가 일치하는 결과로 나왔을 때 이춘재가 범인일 확률은 약 99.99999999999%이다. 만약 재판이 다시 열려서 그 어떤 드림팀이 변호를 맡더라도 이 숫자를 뒤집을 수는 없을 것이다.

물론 이렇게 높은 정확도의 분석도 DNA 시료 자체가 없었다면 불가능했을 것이다. 지금은 예전과 달리 1나노g, 즉 10억분의 1g만 있어도 중합효소연쇄반응이라는 증폭기술을 이용해 DNA를 분석할 수 있다. 코로나19를 높은 정확도로 진단하는 데 적용되는 기술과 근본적으로 같다. 어떻게든 범인을 잡기 위해 오랜 세월 꼼꼼하게 증거를 보존한 경찰의 집념이 첨단과학과 만나 기적과도 같은 성과를 낸 셈이다.

미국의 심슨은 1995년 배심원 무죄 판결을 받고 풀려났다.

▶이종필 교수

경향신문

1971년 부산에서 태어났다. 1990년 서울대학교 물리학과에 입학했으며 2001년 입자물리학으로 박사학위를 받았다. 이후 연세대, 고등과학원 등에서 연구원으로, 고려대에서 연구교수로 재직했다. 2016년부터 건국대 상허교양대학에서 조교수로 재직 중이다. 저서로 <신의 입자를 찾아서> <대통령을 위한 과학 에세이> <물리학 클래식> <이종필 교수의 인터스텔라> <빛의 속도로 이해하는 상대성이론> 등이 있고, <최종이론의 꿈> <블랙홀 전쟁> <물리의 정석> <스티븐 호킹의 블랙홀> 등을 우리글로 옮겼다.


이종필 교수

▶ 인터랙티브:난 어떤 동학개미
▶ 경향신문 바로가기
▶ 경향신문 구독신청하기

©경향신문(www.khan.co.kr), 무단전재 및 재배포 금지

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.