컨텐츠 바로가기

AI가 인간 의사 없앤다? 코로나 진단 맡겼더니 '충격 결과'

댓글 1
주소복사가 완료되었습니다
중앙일보

[중앙포토]

<이미지를 클릭하시면 크게 보실 수 있습니다>


'AI 의사'가 '인간 의사'를 넘어설 수 있을까?

AI(인공지능)의 발전이 미래 산업구조를 바꿀 '핵심 열쇠'로 꼽히는 요즘, 인간이 수행 중인 여러 직업을 대체할 것이란 예상도 심심치 않게 나오고 있다. 특히 신종 코로나바이러스 감염증(코로나19) 이후 고용 구조와 일자리의 성격이 달라지며, 산업구조의 변동 가능성이 더 커졌다.



노동부 "AI 발전으로 의사 폐업 빈번해질 것"



실제로 지난 3월 글로벌 컨설팅 회사 맥킨지는 '코로나19 이후 일자리의 미래'라는 보고서를 통해, 미국 등 선진 5개국의 근로자 10명 중 1명꼴로 향후 10년 이내에 직업을 바꿔야 할 것이란 분석을 내놨다. G7 중 다섯 나라(미국·독일·영국·프랑스·일본)와 중국·인도·스페인 등 8개국에서 800개 직종의 2000개 직무를 분석한 결과다.

이 같은 변화의 물결은 그간 '철밥통'이라고 인식돼왔던 의사들도 피하지 못할듯하다. 고용노동부와 한국고용정보원은 '2021 한국직업전망'에서 의사 직업군에 대해 "의료 분야에 활용 가능한 AI 기술의 발전과 의료시장 경쟁이 심화하면서 개업의의 폐업이나 지역 재배치 그리고 개업의에서 임금을 받고 근무하는 의사로의 전환도 더욱 빈번해질 전망"이라고 예측했다.



코로나 국면 'AI 의사'는 낙제점 "영향 못 미쳤다"



그렇다면 2021년 현재, 'AI 의사'가 '인간 의사'를 위협할만한 성과를 내고 있을까. 지난해 3월 코로나19가 전 세계를 강타하자, 과학계는 앞다퉈 'AI를 활용한 코로나19 진단법'을 개발했다.

코로나19 감염자는 폐가 손상되는 특징이 있는데, 엑스레이나 컴퓨터단층촬영(CT) 결과를 AI로 분석해 코로나19를 빠르고 정확하게 분석하고, 이를 바탕으로 팬데믹 위기를 타개하겠다는 야심 찬 계획이었다. AI가 이미징 분석 분야에서 뛰어난 실력을 갖추고 있기 때문이다.

하지만 코로나 진단법 개발을 시도한 지 1년 반이 지난 지금, AI가 받아든 성적표는 '낙제점'에 가깝다는 게 과학계의 결론이다. 'MIT테크놀로지리뷰'는 지난 7월 30일 자에서 AI를 통해 코로나19로부터 생명을 구할 것이라는 기대가 컸지만, 이 같은 일은 일어나지 않았다고 분석하며 관련 연구를 소개했다.

영국의 국립 AI 연구기관인 앨런튜링연구소도 지난 6월 발표한 '코로나 시대의 데이터 과학과 AI'라는 보고서를 통해 '일련의 워크숍과 토론을 통해 AI가 코로나19와의 싸움에서 거의 영향을 미치지 못했다는 합의를 도출했다'고 밝혔다.

코로나19 국면에서 AI의 활약이 적었다는 건 논문을 통해서도 나타난다고 'MIT테크놀로지리뷰'는 설명했다. 데릭 드릭스 케임브리지대 연구원은 지난 3월 과학저널 '네이처머신인텔리전스'에 발표한 논문을 통해 '엑스레이와 CT 결과를 활용해 코로나19를 예측하는 AI 진단기술' 415개를 분석한 결과를 내놨다.

이들은 연구를 통해 "어느 것도 코로나19 검진 임상사용에 적합하지 않다"고 결론 내렸다. 직접 AI 진단기술 개발에도 나섰던 드릭스 연구원은 "코로나19 팬데믹은 AI와 의학에 대한 일종의 시험이었다"며 "하지만 우리가 그 시험을 통과했다고 생각하지 않는다"고 했다.

지난해 로어 와이넌츠 네덜란드 마스트리히트대 교수는 영국의학저널(BMJ)에 발표한 논문을 통해 코로나19 확진 및 중증도 예측 AI 모델이 대부분 효과가 없었으며, 몇몇 기술은 잠재적으로 해악을 미칠 것이라고 했다.

232개의 AI 모델을 분석한 결과 임상사용에 적합한 것은 한 개도 없었고, 단 2개만이 '좀 더 연구해볼 만하다'고 밝혔다. 와이넌츠 교수는 "몇몇 걱정이 있긴 했지만, 내 예상을 뛰어넘었다"며 "충격적인 결과였다"고 말했다.

중앙일보

미국 국립보건원(NIH)가 공개한 코로나19 바이러스의 확대 모습. AFP=연합뉴스

<이미지를 클릭하시면 크게 보실 수 있습니다>





"AI, 진단 놓치거나 위험 과소평가…오히려 해로워"



전문가들은 "일부 병원에선 잘못 개발된 코로나19 AI 진단 알고리즘을 이미 사용하고 있다"며 "AI가 진단을 놓치거나 중증환자에 대한 위험을 과소평가할 수 있는데, 이같이 잘못된 알고리즘은 오히려 해가 될 것"이라고 우려했다.

그렇다면 AI 의사는 어떤 면이 부족했기에, 코로나19 국면에서 실력을 발휘하지 못했을까. 전문가들은 "AI 개발자들이 대부분 부정확한 데이터를 사용하는 똑같은 실수를 범하고 있다"고 입을 모았다.

AI가 아무리 똑똑하다고 해도, 기본적으로 기존 데이터를 학습해야 이를 바탕으로 분석할 수 있다. 정확한 데이터를 학습해야 정확한 결과를 도출할 수 있는 것이다. 하지만 코로나19 진단기법에 사용된 데이터는 팬데믹 속 긴박한 상황에서 고군분투하는 의료진에 의해 수집된 환자 데이터였다.

잘못된 데이터가 다수 포함돼버린 게 패착이었다. 전문가들은 "AI 개발자들이 사용한 데이터 중 일부는 출처를 알 수 없었고 중복된 내용도 다수였으며, '코로나19에 걸리지 않은 사람'의 자료가 '코로나19에 걸린 사람'으로 잘못 이름 붙여져 AI에 학습되기도 했다"고 지적했다.



'AI 의사' 원조 IBM 왓슨은 국내서 퇴출수순



중앙일보

가천대 길병원은 지난 2016년 국내에서 처음으로 'AI의사' 왓슨을 도입했다. 인천 길병원에서 의료진이 왓슨을 활용해 상담하는 모습. [중앙포토]

<이미지를 클릭하시면 크게 보실 수 있습니다>



한편 'AI 의사'의 원조 격으로 의료계를 뜨겁게 달궜던 IBM의 '왓슨'(Watson for Oncology)은 국내에서 사실상 퇴출수순을 밟고 있다. 왓슨은 전 세계 암 저널과 의학 교과서 등 전문자료를 실시간으로 검색해, 환자의 치료법을 '추천' '추천 고려' '비추천'으로 나눠 제시하는 시스템이다.

IBM 측은 2014년 미국종양학회에서 왓슨의 진단 일치율을 대장암 98%, 직장암 96% 등 평균 96%에 달한다고 소개했다. 국내에선 지난 2016년 가천대 길병원을 시작으로 9개 대학병원에 도입됐다. 하지만 5년가량 지난 지금은 여러 병원에서 더는 그들이 활발하게 진단 활동에 나서는 모습을 찾아볼 수 없다.

가천대는 지난 2017년 도입 1주년 기념 심포지엄에서 왓슨의 질병 진단과 예측 정확도가 50%대라고 밝힌 바 있다. 반타작의 예측 정확도, '인간 의사'보다 정확도가 떨어지는 것이다. 건강보험료 적용 등 국내 의료실정과 맞지 않고 비용 효용성이 떨어지며 대부분의 병원은 재계약을 포기한 상태다. 이는 세계적으로도 비슷한 추세다.



"AI 의사의 실패는 아냐"…데이터 확보가 관건



중앙일보

[사진 Pixabay]

<이미지를 클릭하시면 크게 보실 수 있습니다>



하지만 현재까지의 좌절이 'AI 의사'의 실패를 의미하지는 않는다. 그들의 도전은 앞으로도 계속될 전망이다. 전문가들은 "'AI 의사'가 당장은 의사를 대체하지는 못하겠지만, 데이터를 잘 축적하면 의료진을 돕는 역할을 충분히 할 수 있다"고 입을 모은다.

영국의 보건자선단체 웰컴트러스트의 빌랄 마틴 임상기술팀 의사는 "데이터 형식을 세계적으로 표준화하면 AI를 학습시킬 데이터를 확보하는 게 더 쉽다"고 설명했다. 실제로 세계보건기구(WHO)도 국제 보건위기상황에서 긴급하게 데이터를 공유할 수 있는 방안을 추진하고 있다. '믿을 수 있는 데이터'를 사용하면 'AI 의사'의 정확도를 높일 수 있다는 판단에서다.

전문가들은 또 대부분의 개발자가 기존 'AI 의사' 모델을 개선하기보다는 자체모델을 개발하는 데 더 열중하는 것도 문제로 꼽았다. 전 세계 연구원들이 공동으로 노력하면 하나의 'AI 의사'를 잘 키워낼 수 있다는 의미다.

와이넌츠 교수는 "사실 'AI 의사' 모델들은 서로 매우 유사하다. 비슷한 기술을 사용하고 있으며, 같은 실수를 하고 있다"며 "만약 새로운 개발을 하는 대신 모든 개발자가 이미 개발된 모델을 연구했다면 지금쯤 의료현장에서 실제로 도움이 되고 있었을 것"이라고 밝혔다.

고석현기자ko.sukhyun@joongang.co.kr

중앙일보 '홈페이지' / '페이스북' 친구추가

넌 뉴스를 찾아봐? 난 뉴스가 찾아와!

ⓒ중앙일보(https://www.joongang.co.kr), 무단 전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.