유창동 KAIST 교수(전 한국인공지능학회장)
"로봇과 신약 개발에서 AI가 가장 활성화될 것"
강하고 모호한 규제로 AI 학습 데이터 확보 어려워
"가명화하면 역추적해 정보 알아내는 기술 없어"
"온디바이스AI 정부 지원 부정적..한국형 LLM 필요"
유창동 KAIST(한국과학기술원) 전기및전자공학부 교수(전 한국인공지능학회장)는 21일 열린 한국데이터법정책학회 이성엽 교수 연구실이 주최한 세미나에서 이같이 밝혔다.
유 교수는 과학기술정보통신부 인공지능 공정성연구센터장도 맡고 있다.
유창동 KAIST 전기및전자공학부 교수(전 한국인공지능학회장) 사진=본인 제공 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
보스턴컨설팅그룹에 따르면 세계 로봇 시장은 2020년 250억달러에서 2023년 400억달러로, 2030년에는 1600억달러까지 성장할 것으로 전망되고 있다. 지난해 말 차세대 휴머노이드 ‘옵티머스 2세대’를 공개한 테슬라나, 미국 로봇 업체 보스턴 다이내믹스를 인수한 현대차, 레인보우로보틱스에 지분 투자한 삼성전자 등 대기업들의 움직임이 빨라지는 것도 거대언어모델(LLM)과 로봇이 결합하면 파괴력이 크기 때문이다. 언어로 지시하는 LLM의 특성상, 사람처럼 사고하고 움직이는 로봇이 가능해지는 것이다.
유 교수는 “AI가 로봇과 결합하면 사람처럼 되는 것”이라면서 “AI가 프로그램을 만들어 로봇을 제어할 텐데 식당에 가면 주문을 받는 사람이 사라지고 호텔에서도 마찬가지”라고 예상했다. 특히 그는 “LLM이 로봇과 결합하면 속도가 빨라질 것”이라고 예상하면서 “로봇 대여 업체 등 생태계도 활성화될 것”이라고 예상했다.
신약 개발 등 바이오 부분도 AI 적용으로 급성장할 분야로 꼽힌다. 유 교수는 “로봇과 신약 개발, 2가지가 머리에 떠오른다”고 했고, 며칠 전 인터뷰 한 이광형 KAIST 총장은 “전 세계 의료·바이오 시장은 전 세계 반도체 시장보다 4배 이상 크다”면서 “그런데 우리나라가 차지하는 부분은 1%에 불과하다”며, 의사과학자 육성이 필요하다는 소신을 밝히기도 했다.
AI 학습용 데이터, 가명화하면 역추적 어려워
하지만, 우리나라에서 AI 서비스를 개발하기는 쉽지 않은 현실이다. 바로 강한 데이터 접근 규제(개인정보보호법상 규제)와 규제의 불명확성 때문이다.
유창동 교수는 “AI는 수많은 데이터를 입력해 뇌를 모방한 함수”라고 정의하면서, 함수(알고리즘)보다는 데이터가 더 중요하다고 전제했다.
하지만 그는 가명화된 데이터에 대해서는 AI 개발 기업의 접근성을 좀 더 높여줄 필요가 있다는 입장도 밝혔다.
가명정보란 개인정보를 가명처리하여 원래의 상태로 복원하기 위한 추가 정보의 사용·결합 없이는 특정 개인을 알아 볼 수 없는 정보를 의미한다.
하지만, 국내 개인정보보호법제에서는 가명정보도 개인정보로 보고, 엄격한 의무를 주고 있다. 이에 따라 AI 학습용 데이터를 구하기 어렵다는 게 국내 기업들 하소연이다. 게다가 개인정보보호법에는 공개된 정보에 대한 규정이 없어 기업들이 개발에 어려움을 겪고 있다.
아울러 최근 IT 업계에서는 AI에서 데이터를 학습한다는 의미가 기존 개인 정보 처리와 다르고, 이를테면 검색 엔진 작동법과 유사하지 않느냐 하는 주장도 나오고 있다.
한국인공지능학회장을 지냈고, 인공지능 공정성 평가 툴까지 개발한 유창동 교수는 이 문제를 어떻게 생각할까.
유 교수는 “현재의 법과 기술이 조금 괴리가 있는 상황”이라고 진단하면서 “이를테면 (가명정보는) 학생의 전체 과목 평균을 의미한다고 볼 수 있는데, 여기서 국어 성적을 역추적해서 알아낼 수 있느냐 하는 것이다. 그런데 학습된 모델로 이를 역추적해서 정보를 알아낼 수 있는 기술은 현재는 없다”고 말했다. 가명화됐다면 일부라도 손쉽게 AI 학습용으로 쓸 수 있게 허용해야 한다는 취지로 읽힌다.
온디바이스AI 정부 지원 부정적..한국형 LLM 필요
유 교수는 오픈AI, 구글, 메타 등이 주도하는 LLM 생태계가 자본력 싸움으로 가고 있다면서, 대한민국 고유의 LLM 개발이 필요하다고 역설하기도 했다.
특히 인터넷 연결 없이도 디바이스 자체에서 AI 기능을 수행하는 ‘온디바이스 AI’에 대해선 부정적인 반면, 데이터 주권 확보를 위해 한국형 LLM 개발과 지원은 절실하다고 해서 눈길을 끌었다. ‘온디바이스 AI’ 전략 수립은 과학기술정보통신부의 올해 주요 정책 방안 중 하나다.
그는 “이제 파운데이션 모델 개발 경쟁은 어느 정도 끝났다고 본다”면서 “이제 우리나라의 스탠스를 취해야 할 것 같다”고 했다.
그러면서 “제가 보기에는 AI 경량화 모델(온디바이스AI)를 국가가 주도해서 하기보다는 LLM 자체를 개발해야 한다”면서 “소형 인공지능을 개발한다는 건 그냥 말 장난 같다. LLM을 클라우드나 인터넷으로 연결해서 사용하면 될 것이지, 번역 등 일부 기능을 위해 굳이 소형화해서 단말기에 넣을 필요가 있을 까 하는 게 개인적인 생각”이라고 했다.
이어 “국가적으로는 상업성은 없어도 우리의 자체 LLM을 개발할 필요가 있다고 본다. 미국과 지금은 우호관계이지만 앞으로 외교 관계가 어떻게 될지 모르기 때문”이라면서 “만약 트럼프 대통령이 나와 챗GPT 수출을 금지하면 어떻게 될까. 각각의 개별 기업들이 하기보다는 국가적으로 힘을 모아서 LLM을 만들고 이를 파인튜닝(미세조정)해서 쓰는 것도 방법이 될 수 있을 것”이라고 했다.
다만, 국가 차원의 LLM 개발에 대해선 이견도 존재했다.
이성엽 한국데이터법정책학회장은 “저는 생각이 조금 다른데 지금 국가가 주도해 뭐 하나를 만드는 것은 오히려 더 어려울 것 같다”며, 네이버나 LG, KT, SKT 등 자체 LLM을 개발하는 기업들에 규제를 풀어주는 일이 더 필요하다는 의견을 제시했다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.