컨텐츠 바로가기

06.01 (토)

세계 최대 커뮤니티 레딧 '살아 있는 데이터', 챗GPT 훈련에 쓰인다

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
오픈AI, 레딧과 파트너십 계약 체결
AI 훈련 위한 '실시간' 정보 대량 확보
한국일보

세계 최대 온라인 커뮤니티 '레딧'의 로고. 로이터 연합뉴스

<이미지를 클릭하시면 크게 보실 수 있습니다>


생성형 인공지능(AI) 챗GPT 개발사 오픈AI가 세계 최대 온라인 커뮤니티 업체 '레딧'과 파트너십을 맺었다. 오픈AI는 레딧의 콘텐츠를 챗GPT 훈련에 활용하고, 레딧은 오픈AI의 AI 모델을 광고 사업과 이용자를 위한 AI 기능 개발 등에 이용한다는 게 협력의 골자다.

2005년 설립된 레딧은 일일 순 방문자가 7,000만 명이 넘는 분권형 커뮤니티다. 사이트 안에는 사진·영상·글 등을 공유할 수 있는 10만 개 이상의 주제별 게시판이 있는데, 각 게시판은 이용자들이 직접 만들고 운영한다. 한국으로 치면 디시인사이드와 비슷하다.

올트먼, 레딧 지분 1조 원 이상 보유


양 사는 16일(현지시간) 파트너십 계약 체결 사실을 발표했다. 계약 금액은 밝히지 않았다. 스티브 허프먼 레딧 최고경영자(CEO)는 "레딧은 항상 최신인 사람들 간 대화를 담고 있는 인터넷 최대의 공개 저장소"라며 "챗GPT가 레딧에 들어오면 이용자들이 원하는 것을 더 많이 찾는 한편 새로운 이용자가 유입되는 데 도움이 될 것"이라고 밝혔다. 이 소식에 이날 레딧 주가는 시간 외 거래에서 11% 이상 폭등했다. 레딧은 지난 3월 뉴욕 증시에 상장했다.

오픈AI에서는 브래드 라이트캡 최고운영책임자가 이번 거래를 주도한 것으로 알려졌다. 다만 샘 올트먼 최고경영자와 레딧 간 '특수 관계'가 거래 성사에 결정적인 영향을 줬을 거라는 게 업계의 시각이다. 올트먼은 한때 레딧의 이사를 지냈고, 레딧의 초기 투자자로서 현재도 대주주 중 하나다. 이날 기준 올트먼이 보유한 레딧의 지분은 7억5,000만 달러(약 1조125억 원) 상당이라고 미국 경제매체 CNBC는 전했다.
한국일보

샘 올트먼 오픈AI 최고경영자. AFP 연합뉴스

<이미지를 클릭하시면 크게 보실 수 있습니다>


오픈AI, 신조어 등 실시간 데이터 확보


이번 계약으로 오픈AI는 '살아 있는' 데이터를 대량으로 확보할 수 있게 됐다. 젊은 이용자가 많은 커뮤니티의 특성상 레딧에는 주제를 막론하고 실시간으로 이슈가 공유된다. 뉴스 기사 등 정제된 데이터에서는 제한적으로 얻을 수밖에 없는 신조어도 많다. 오픈AI는 페이스북·인스타그램 등을 운영하는 세계 최대 사회관계망서비스(SNS) 업체 메타, 산하에 유튜브를 둔 구글과 비교해 살아 있는 데이터를 얻기가 어렵다는 게 치명적 약점으로 꼽혀왔었다. 그러나 레딧과의 계약으로 경쟁사들을 바짝 쫓을 수 있게 됐다. 다만 레딧은 지난 2월 구글과도 라이선스 계약을 체결했다.

오픈AI는 저작권 침해 관련 사법 리스크를 없애고자 최근 콘텐츠 저작권자들과 콘텐츠 라이선스 계약을 확대하면서 훈련용 데이터를 '정당하게' 확보하고 있다. 지난달에는 130여 년의 역사를 가진 영국 파이낸셜타임스(FT)와 계약을 맺어 화제를 모았다.


실리콘밸리= 이서희 특파원 shlee@hankookilbo.com


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.