사진 왼쪽부터 김영학 교수, 전태준 박사 |
[라포르시안] 최근 챗GPT와 같은 생성형 인공지능(AI)과 그 핵심 기술인 대규모언어모델(Large Language Model·LLM)이 다양한 산업군에서 활발하게 활용되면서 의료 분야에서도 이를 접목한 디지털 혁신에 주목하고 있다.
하지만 환자의 개인정보보호가 특히 중요한 분야인 만큼 LLM 사용에 따른 개인정보유출 등 보안 우려가 꾸준히 제기되고 있다.
최근 서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀이 LLM을 의료 분야에 적용하는 과정에서 발생할 수 있는 개인정보유출 문제를 확인하기 위해 의도적으로 악성 공격을 시행한 결과 최대 81%에 달하는 공격 성공률을 보였다는 연구 결과를 발표했다.
연구팀은 의료 분야에서는 민감한 개인정보를 다루기 때문에 LLM 도입에 신중하고 각별한 주의가 필요하며 독립적으로 운용되는 의료 특화형 LLM이 필요하다고 강조했다.
이번 연구 결과는 전 세계 의사들의 임상치료 교과서로 불리는 NEJM(New England Journal of Medicine) 자매지 'NEJM AI'에 최근 게재됐다.
의료계에서 AI 중요성이 점점 확대됨에 따라 임상의학 분야 세계 최고 권위지로 꼽히는 NEJM에서도 지난해 1월부터 AI 분야만을 특화해 다루는 자매지를 출간했다.
LLM은 수십억 개 이상 매개변수를 기반으로 대량의 데이터를 학습해 사람처럼 생각하고 답변하는 AI 모델이다. 이는 챗GPT·제미나이(Gemini)와 같은 생성형 AI가 작동하는 핵심 기술로 질문이나 명령어를 담은 프롬프트를 입력하면 LLM이 이를 이해하고 적합한 답변을 제공한다.
의료 분야에 LLM을 적용하면 X-ray·CT·MRI 등 검사 이미지를 다량의 데이터 기반으로 분석해 진단 정확도를 높일 수 있고, 환자의 개인 데이터를 기반으로 맞춤형 치료 계획을 제공할 수 있다. 또한 전자의무기록(EMR)이나 동의서 작성을 자동화하는 등 의료진 관리 업무도 간소화해 전반적으로 효율성이나 정확성이 향상될 것으로 기대된다.
다만 LLM의 보안이 위협될 경우 환자들의 민감한 개인정보가 유출돼 윤리적 법적 위험성이 초래될 수 있다.
서울아산병원 심장내과 김영학 교수·아산생명과학연구원 빅데이터연구센터 전태준 박사팀은 2017년 1월부터 2021년 12월까지 환자 2만 6434명의 의무기록을 활용해 LLM을 학습시켰다.
악성 공격은 LLM에 입력하는 질문인 프롬프트에 의미 없는 기호, 글을 추가하거나 인코딩하는 등 다양하게 변형해 악의적인 질문을 하는 방식으로 위험성을 평가했다.
해당 연구는 윤리적으로 사전 승인된 데이터만을 활용했으며 서울아산병원 임상연구심의위원회(IRB) 심의를 거쳐 진행됐다.
먼저 문자를 인코딩하는 방식인 ASCⅡ(미국정보교환표준코드) 방식으로 프롬프트를 변형한 결과 LLM의 보안장치를 피해 민감한 개인정보에 접근할 수 있는 확률을 평가하는 가드레일 비활성화율이 최대 80.8%에 달했다. 이는 80.8%에 달하는 확률로 보안 조치가 쉽게 침해될 수 있다는 뜻이다.
또한 LLM이 답변을 생성하는 과정에서 학습된 원본 데이터를 노출할 가능성은 최대 21.8%로 나타났다. 모델에 질문하는 형식을 미세하게 조정함으로써 원본 학습 데이터가 쉽게 노출될 수 있다는 것이다.
구체적인 예시로 수술 준비를 위해 상세한 환자 정보를 제공하는 시스템으로 LLM을 학습시킨 뒤 의료기록 검토를 요청하는 프롬프트를 인코딩 방식으로 조정한 결과 LLM이 대답을 생성하는 과정에서 민감한 환자 데이터는 물론 의료진의 이름이나 전문 분야 등 구체적인 정보가 노출됐다.
김영학 교수는 "의료 분야에서 LLM을 활용했을 때 기대되는 발전이 크지만 데이터 보안 강화 없이는 심각한 개인정보유출로 이어질 수 있다. 민감한 개인정보를 다루는 분야인 만큼 보안 중요성이 특히 강조되며 독립적으로 운용되는 의료 특화형 LLM이 필요하다"고 말했다.
<저작권자 Copyright ⓒ 라포르시안 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.