구글은 인간의 검색 행위를 모방하는 API를 고객에게 제공하는 웹 스크래핑 기업 서프API를 상대로 소송을 제기했다. 구글의 이번 조치는 인공지능 대규모 언어 모델의 학습과 운영을 위한 데이터 접근권을 둘러싼 분쟁이 최신 국면으로 접어들었음을 의미한다.
현재 인공지능 서비스에 활용되는 다수의 대규모 언어 모델은 웹사이트 소유자의 인지나 허가 없이 웹사이트에서 스크래핑한 데이터로 학습됐다. 현재 저작권 보유자는 인공지능 기업이나 공급사를 상대로 소송을 제기하거나 수백만 달러에서 수십억 달러 규모의 라이선스 계약을 체결하며 대응에 나서고 있다.
구글은 이 분쟁의 양측에 모두 관여하고 있다. 구글은 세계 최대 규모의 데이터 세트 중 하나를 수집·관리하는 동시에 자체 대규모 언어 모델 제품군인 제미나이를 학습시키고 있으며, 제미나이를 검색을 포함한 자사 서비스 전반에 통합하고 있다.
다른 기업은 경쟁 인공지능 제품을 개발하기 위해 해당 데이터 세트에 접근하려 하고 있으며, 구글은 이러한 움직임을 위협으로 보고 있다.
구글 법무책임자 할리마 델레인 프라도는 소송을 알리는 블로그 게시글에서 서프API가 “구글 검색 결과에 표시되는 타인의 저작권 콘텐츠를 보호하는 보안 조치를 우회하고 있다”고 밝혔다. 프라도는 “법원에 서프API의 봇과 악의적인 스크래핑을 중단해 달라고 요청하기 위해 소송을 제기했다”며 “해당 행위는 웹사이트와 권리자가 자신의 콘텐츠 접근 주체를 선택할 권리를 침해한다”고 설명했다.
구글은 검색 결과 대부분을 자체적으로 웹사이트를 스크래핑해 확보하고 있지만, 프라도는 이번 소송이 구글이 라이선스를 받았거나 자체 제작한 콘텐츠에 대한 서프API의 접근을 겨냥한다고 밝혔다. 프라도는 “서프API는 지식 패널에 표시되는 이미지, 검색 기능의 실시간 데이터 등 구글이 타인으로부터 라이선스한 콘텐츠를 기만적으로 취득한 뒤 유료로 재판매하고 있다”며 “이 과정에서 검색에 콘텐츠를 제공하는 웹사이트와 공급자의 권리와 지침을 고의로 무시하고 있다”고 적었다.
서프API는 위법 행위를 부인하며, 브라우저를 통해 누구나 접근할 수 있는 공개 검색 데이터와 동일한 정보를 개발자, 연구자, 기업에 제공한다고 밝혔다. 서프API는 서면 성명에서 “이번 소송은 차세대 인공지능, 보안, 브라우저, 생산성 등 다양한 애플리케이션을 구축하는 혁신 기업의 경쟁을 억제하려는 시도”라고 주장했다. 이어 “웹사이트에 명시한 바와 같이 공개 데이터의 크롤링과 파싱은 미국 헌법 수정 제1조의 보호를 받는다”며 “공정 이용 원칙을 포함한 모든 관련 법률을 준수하도록 법률 자문과 긴밀히 협력하고 있으며, 사업 모델을 확고히 지지하고 법정에서 적극 대응할 것”이라고 밝혔다.
구글은 경쟁사가 서프API로부터 받고 있는 지원에 특히 민감하게 반응하고 있는 것으로 보인다. 8월, 디인포메이션은 오픈AI와 퍼플렉시티가 서프API의 고객이라고 보도했다.
공짜 시대의 종말
일부 전문가는 이번 소송이 인공지능 기업의 무임승차 시대가 끝나가고 있음을 보여주는 신호라고 보고 있다.
인공지능 검색 최적화 컨설팅 기업 하턴웍스 창립자 마틴 제프리는 “콘텐츠 사용에 대한 법적 틀이 불분명하기 때문에 인공지능 개발이 매우 빠르게 진행되고 있다”며 “기업은 허가나 명확한 기준을 기다리기보다 인공지능 검색 노출을 우선 최적화하고 있으며, 이러한 배경이 구글의 이번 조치로 이어졌을 수 있다”고 말했다.
인공지능 마케팅 기업 ai리절츠 최고경영자 맷 하산도 같은 견해를 밝혔다. 하산은 “콘텐츠 제공자의 반발 없이 빠르게 움직일 수 있었던 시기는 분명히 끝나가고 있다”며 “법적·규제적 제약이 강화되면서 실험 속도는 둔화되고, 제품 개발은 신중해지며, 방어 가능한 라이선스 데이터나 수직 통합형 데이터 전략으로 이동할 가능성이 높다”고 말했다. 이어 “인공지능 발전이 멈추는 것은 아니지만, 누가 얼마나 빠르게 참여할 수 있는지는 재편될 것”이라고 덧붙였다.
제프리는 구글의 이번 조치가 자체 인공지능 제품 개발에도 도움이 될 것이라고 평가했다. 제프리는 “구글은 제미나이에서 다소 뒤처졌지만 현재는 따라잡고 있으며 제미나이를 거의 모든 서비스에 적용하고 있다”고 말했다. 이어 서프API에 대한 조치 이후 행보에 대해 “소송에서 승리할 경우 더 큰 기업으로 확대할지 지켜보고 있다”며 “우선 소규모 기업을 겨냥한 경고성 조치로 보인다”고 언급했다.
구글의 인공지능 시장 공세로 제미나이 경쟁사 일부가 영향을 받기 시작했다는 신호도 나타나고 있다. 이달 초, 오픈AI 최고경영자 샘 올트먼은 구글의 시장 진입에 맞서 선두 지위를 유지하기 위해 ‘코드 레드’ 경보를 선언했다.
서프API에 대한 소송은 구글이 경쟁 인공지능 기업의 데이터 활용을 제한하려는 첫 시도가 아니다. 10월, 구글은 검색 요청당 제공 결과 수를 기존 100개에서 10개로 제한했다. 이 조치로 구글 사이트를 스크래핑하던 기업은 동일한 결과를 얻기 위해 크롤링 규모를 대폭 늘려야 했다.
dl-itworldkorea@foundryco.com
Maxwell Cooter editor@itworld.co.kr
저작권자 Foundry & ITWorld, 무단 전재 및 재배포 금지
