치열해지는 AI 시장…구글의 경쟁사 견제
[연합뉴스] |
구글이 인공지능(AI)을 학습시키고자 구글 검색 결과를 대량으로 긁어모은 스타트업을 상대로 소송전을 시작했다. 글로벌 AI 시장 경쟁이 치열해지자 라이벌을 견제하려는 의도로 풀이된다. 구글도 제미나이를 개발하는 과정에서 뉴스와 도서, 그림 등 콘텐츠를 무단으로 사용해 법적 분쟁에 휘말린 적이 있는 만큼 이중적 태도라는 지적이 나온다.
22일 정보기술(IT)업계에 따르면 최근 구글은 스타트업 서프Api가 저작권을 침해하고 있다며 미국 캘리포니아 북부연방지법에 소송을 제기했다. 서프Api는 크롤링 및 스크래핑으로 오픈AI에 데이터를 공급하는 회사로 알려져 있다.
크롤링은 수많은 인터넷 사이트를 탐색하며 정보들을 복제·저장하는 자동화 기술을 의미한다. 스크래핑은 이렇게 수집된 정보 사이에서 특정한 데이터를 추출해 재사용할 수 있도록 해 준다. 주로 검색 결과를 생성하거나 AI 모델을 훈련하는 용도로 사용된다.
구글은 서프Api가 웹사이트별 지정한 크롤링 지침을 무시하고 구글의 보안 시스템까지 무단으로 우회해 검색 요청을 보내 데이터를 가지고 갔다고 주장했다. 또 구글이 라이선스 계약을 맺고 제공하는 콘텐츠를 서프Api가 유료로 재판매하고 있다고 비난했다. 구글은 서프Api의 위반 사항별 손해배상액을 200~2500달러로 산정했다.
구글은 “서프Api는 자신을 숨기고 대규모 봇 네트워크를 통한 웹사이트 폭격을 벌이고 크롤러에 가짜 이름을 돌려 쓰는 등 백도어를 이용하고 있다”라며 “서프Api의 사업모델은 기생충 같다”고 언급했다.
오픈AI와 협력관계인 서프Api 뿐만이 아니다. 구글은 수많은 크롤링 기업들이 데이터와 콘텐츠를 퍼플렉시티나 메타를 포함한 경쟁사에 넘겼다고 판단해 경고와 법정 공방을 이어가는 등 고군분투하고 있다.
[챗GPT] |
하지만 구글도 무단으로 데이터를 제미나이 학습에 사용해 소송을 당했다. 구체적으로 지난 9월 예술가들이 구글을 상대로 저작권 침해 소송장을 날렸다. 구글의 이미지 생성형 AI가 데이터를 수집해 활용했다고 강조했다. 사용자들도 구글이 데이터와 개인정보를 상업적으로 이용하면서 충분한 동의를 구하지 않았다며 집단소송에 나섰다. 언론사도 마찬가지다.
테슬라는 사회관계망서비스(SNS) 엑스(X)의 데이터 약탈을 막겠다고 엄포를 놨으면서도, X 사용자들이 쌓아온 데이터를 AI 챗봇 그록 학습에 썼다. 아마존은 다른 AI 기업의 아마존 접근을 차단했다. 메타도 페이스북과 인스타그램의 데이터를 노리는 기업들을 비판하고 있지만, 도서·기사를 불법으로 복제·수집해 작가·출판단체로부터 소송이 걸렸다.
이처럼 구글을 포함한 빅테크들은 자신들이 데이터를 모으는 것은 괜찮고 다른 기업들이 데이터를 사용하는 것은 불법이라며 막아내는 모습이다. 앞서 미국 사법기관은 법무부가 구글을 상대로 벌인 반독점 소송을 통해 구글에게 검색 색인과 데이터를 경쟁사와 공유하라고 명령한 바 있다. 다만 광고나 검색 결과를 구성하는 알고리즘은 공유 대상에서 제외했다.
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
