조현래 용인대 문화콘텐츠학과 특임교수·前 한국콘텐츠진흥원장 |
AI는 텍스트 중심의 학습에서 벗어나 사람의 음성과 표정, 영상 등 다양한 형태의 데이터를 학습하는 단계로 발전하고 있다. 맥락과 사람의 감정까지도 학습하고 새로운 산출물을 만들어낼 수 있다.
문제는 AI가 콘텐츠 학습을 하기 위한 데이터가 그냥 주어지는 것이 아니라는 것이다. AI는 누군가가 만든 기존의 콘텐츠나 인터넷 검색을 통해 확보한 콘텐츠 데이터를 통해 학습하고, 이를 바탕으로 AI를 활용한 새로운 콘텐츠가 만들어진다. 콘텐츠 데이터 학습과 AI 콘텐츠 산출로 인해 콘텐츠 창작자와 AI 플랫폼 기업간에 분쟁과 갈등이 확산되고 있다. AI 기술이 더욱 발전되고 콘텐츠 생태계에 깊이 관여하게 될수록 갈등 이슈는 더욱 민감해질 것이다. 갈등과 분쟁의 심화는 콘텐츠 데이터 학습의 불확실성을 높이고 콘텐츠 산업 발전을 저해하게 된다.
국내외적으로 나타나는 분쟁과 갈등의 주요 쟁점은 AI 학습을 위한 데이터 수집에서부터 시작된다. 데이터 수집과 학습에 대해 AI 개발기업들은 공정이용이라고 하고, 콘텐츠 창작자들은 저작권 침해라고 주장한다. 창작의 소재가 되는 데이터는 아이디어와 표현의 이분법 등에 따르면 저작권 보호대상이 아니라고 볼 수 있으나 AI가 학습하고 콘텐츠를 만드는 과정에서 활용되는 것은 기존 콘텐츠에서 추출된 자료라는 것이다. 디즈니는 지난 연말 오픈AI와 라이선스 계약을 통해 AI 학습 데이터에 시장가격이 있을 수 있다는 것을 보여주었다. 라지액트는 '학습영향력 증명 기술'을 통해 영향력 분석을 할 수 있다며 K콘텐츠IP사들과 함께 오픈AI에 소송을 제기한 상태다. 사회적 합의를 통한 제도화가 이뤄지지 않으면 분쟁은 지속되며 법적 분쟁을 통해 해결은 비용과 시간이 많이 소요된다.
우리 저작권법은 AI의 콘텐츠의 데이터 수집과 학습에 대해서 구체적으로 정한 조항이 없다. 공정이용 조항으로 가능하다는 견해도 있으나, 불확실성 리스크가 남아 있다. 유럽연합(EU)은 2019년 저작권 및 저작인접권과 관련된 지침을 개정해 '텍스트 및 데이터의 분석(Text and Data Mining)'의 예외 규정을 도입했고, 일본도 2018년 저작권법 개정을 통해 저작물의 비표현적 이용을 권리제한 사유로 넣어 데이터 학습이 가능하도록 하였다. 우리는 2021년 저작권법 개정안에서 AI의 정보분석에 대해 면책조항을 신설하고자 하였으나 국회 회기 종료로 제도화되지 못하고 있다.
여기서 한류와 AI의 K콘텐츠 데이터 학습과 연관시켜 보자. 한류는 K콘텐츠의 글로벌 확산에서 찾아진다. AI의 K콘텐츠 데이터 수집과 학습에 대한 불확실성과 리스크가 큰 경우 AI 플랫폼 기업들은 K콘텐츠 학습을 배제하거나 최소화하게 될 것이다. K콘텐츠를 학습하지 못한 AI는 콘텐츠 제작에 있어 이른바 '한국다움'을 만들어내기 어려울 수 있다. 한국다움이 사라진 콘텐츠가 만들어지고 유통되는 것이 한류의 확산에 기여할 수 있을지 의문이다. AI의 K콘텐츠 데이터 수집과 학습의 불확실성을 해소할 수 있는 제도가 시급하다.
조현래 용인대 문화콘텐츠학과 특임교수·前 한국콘텐츠진흥원장
[Copyright © 전자신문. 무단전재-재배포금지]
