구글은 AP통신으로부터 기사를 제공받아 비서처럼 이것저것 물어볼 수 있는 자사 생성형 AI(인공지능) 서비스 ‘제미나이’를 학습시키려 한다. 전 세계 수억 명의 이용자가 ‘중국 딥시크의 생성형 AI는 왜 뛰어난 거야?’라는 식으로 제미나이에 물어볼 때마다 AP통신 기사를 근거로 정확한 답변을 제공해 사용자 신뢰를 얻겠다는 계산이다. 핵심 사업인 만큼 뉴스 사용료로 연 수십억 원을 줄 것으로 추정된다.
구글이 하루아침에 선해진 것도 아닐 테고 큰 금액을 언론사에 투자한 이유는 무엇일까. 구글은 과거 전 세계 기사를 마구 쓸어와서 미끼 상품처럼 사용자들의 관심을 모으는 데 사용했다. 그렇게 유입된 사람들을 상대로 광고·온라인 쇼핑을 전개해 큰돈을 벌었다. 기사 원문으로 연결되는 아웃링크를 걸어 놓았다는 이유로 기사에 대한 대가를 지불하지 않아도 큰 문제가 되지 않았다.
그런데 생성형 AI 등장으로 상황이 달라졌다. 오픈AI의 챗GPT같은 생성형 AI보다 더 똑똑한 AI를 만들려면 양질의 데이터가 필수다. 블로그·소셜 미디어에 떠도는 거친 말보다 정제된 언어를 학습시켜야 효과가 좋다는 것을 깨달은 것이다. 구글이 AI 개발에 투입한 데이터를 들여다본 결과 가장 데이터를 많이 활용한 사이트 상위 10곳 중 5개(2023년 기준)가 뉴스 사이트였다.
그런데 한국에선 이런 사례가 없다. 챗GPT를 비롯해 한국인들도 다수 사용하는 해외 AI는 우리말로 물어봐도 매끄럽게 답할 정도로 한국어 서비스가 고도화했다. 분명 이들도 한국 뉴스 기사를 학습했을 것이다. 하지만 지금까지 어떤 빅테크도 한국 언론사에 뉴스 사용료를 냈다는 말은 들어보지 못했다.
[최인준 기자]
- Copyrights ⓒ 조선일보 & chosun.com, 무단 전재 및 재배포 금지 -
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.