컨텐츠 바로가기

05.21 (화)

[2019 데이터경제] 데이터 기반 업무 자동화, 한화시스템 “데이터 전처리가 중요”

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
디지털데일리

<이미지를 클릭하시면 크게 보실 수 있습니다>


[디지털데일리 이상일기자] 쉐라톤 서울 디큐브시티호텔 그랜드볼룸에서 열린 <디지털데일리>주최 '[2019 데이터경제]데이터 기반 엔터프라이즈 혁신 전략 컨퍼런스'에서 '인공지능 기반 비즈니스 프로세스 자동화 혁신 전략'을 발표한 한화시스템 ICT부문 정해진 부장은 '자동화 업무 프로세스 구현에 있어서 데이터 전처리 작업이 중요하다'고 강조했다.
한화시스템은 클레임 업무에 AI도입을 통해 보험 심사 프로젝트를 효율화 해 프로세스 소요시간을 단축하고 정확도 향상 및 심사 비용을 절감하는 시도에 나섰다. 캐나다의 AI 솔루션 기업 '엘레멘트 AI'(Element AI)사와 협업을 통해 진행된 것도 주목된다.
엘레멘트 AI는 딥 러닝(Deep Learning)의 창시자 요슈아 벤지오 캐나다 몬트리얼대학 교수가 공동 창업한 회사다. 요슈아 벤지오 교수는 얀 리쿤 뉴욕대 교수(페이스북), 제프리 힌턴 토론토대 교수(구글) 등과 함께 딥 러닝 분야 3대 대가로 불리는 인공지능 대가다. 한화시스템은 이 회사에 지분을 투자한 바 있다.
클레임 업무는 보험 가입자가 청구서, 진료비 영수증, 진단서 등의 필요 서류를 갖춰서 보험금을 청구하는 절차를 의미한다.
한화시스템은 보험 가입자가 병원에서 진료를 받은 후 의료비를 청구하는 클레임 업무 프로세스에 있어 기존에 수기로 처리하는 과정에서 시간이 증가하고 심사자 개인의 차이로 인해 심사 정확도 상향 평준화가 필요하다는 인식 아래 관련 사업을 추진했다.
이를 통해 AI기반의 심사 프로세스 선진화를 통한 비즈니스 경쟁력을 강화하고 업무 표준화와 자동화를 통한 심사 프로세스 단축 및 심사 정확도 향상을 꾀했다. 부가적으로 외부 심사 축소를 통해 심사 비용 절감도 추진했다.
우선 AI심사 프로세스 도입을 통해 자동으로 지급 여부를 판단하고 AI심사 이전에 통원여부와 사람의 심사 여부를 걸려내는 단계를 추가했다.
정해진 부장은 '조건에 맞게 지급을 판단하는 부분에서 건수가 많다 보니 모든 룰을 적용하기 어려워 머신러닝을 적용해 가능성을 판단했다. 우선 '통원'만을 대상으로 했으며 향후 입원 등도 적용해볼 계획'이라고 밝혔다. AI프로젝트는 데이터 준비, 모델링, 평가의 과정으로 구분된다.
정 부장은 '보장 및 심사, IT, 현장 담당 등에 인터뷰를 진행해 바로 활용 가능한 데이터와 전처리 필요 데이터를 구분했다. 전체 데이터 중 전처리 부분이 8할을 차지할 정도로 어렵다. 데이터를 잘 만들어가는 부분이 전처리 부분이다. 이후 데이터 검증 및 모델 개발을 진행하고 매트릭스 및 건강심사평가원의 평가 및 검토를 통해 신뢰성을 확인했다'고 전했다.
데이터 분석 과제를 해결하기 위해서는 데이터 처리를 위한 알고리즘을 빨리 찾는 것이 중요한데 이러한 알고리즘을 가지고 한화시스템은 100개의 데이터 테이블을 기반으로 비즈니스 상 유의미한 데이터를 도출했다. 이후 러닝 데이터 셋 도출을 통해 60개 테이블, 2000여 컬럼 데이터를 뽑아 그 중 350개 정형 컬럼과 비정형 30컬럼을 도출했다. 이는 분석 및 학습관점에서 유의미한 데이터라는 설명이다.
또, 시스템에서 발생하는 비정형 데이터들을 AI 학습에 활용하기 위해 보상업무와 유관한 단어 정보, 예를 들어 '통증부위', '질병 및 증상', '처치' 등을 추출해 정형화했다. 정해진 부장은 '데이터셋에 맞는 알고리즘 후보군들을 선정하고 가장 정확도가 높은 알고리즘을 활용해 고도화 작업을 진행하는데 학습은 꼭 필요한 데이터만으로 진행해야 한다'고 강조했다.
또 그는 '여러 버전의 학습 모델을 만들어 분석 검증하고 결과를 다시 모델에 반영, 재학습하는 과정을 거쳐 최적의 모델을 선정할 필요가 있다'고 덧붙였다.
한편 이번 프로젝트는 5개월 간 안정화 기간을 거쳤다. 1차 AI학습과정에선 정형데이터만을 대상으로 했으며 2차 AI학습에 비정형 데이터를 포함시켰다. 정 부장은 '정형 데이터와 비정형 데이터 셋(SET)을 도출하고 반복적인 학습을 통해 모델의 정확도를 높여갔다'고 설명했다.
<이상일 기자>2401@ddaily.co.kr

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.