"데이터 무단 수집"…레딧, 퍼플렉시티 소송

"데이터 스크래핑 기업도 가담…정답엔진 학습에 활용" 주장

컴퓨팅입력 :2025/10/23 11:46

레딧이 웹페이지 데이터를 무단 수집했다는 혐의로 퍼플렉시티에 소송을 제기했다.

23일 테크크런치 등 외신에 따르면 레딧은 이같은 이유로 미국 뉴욕 연방 법원에 소장을 제출했다. 

소장에는 퍼플렉시티를 포함한 데이터 스크래핑 기업들이 AI 학습용 데이터를 확보하기 위해 레딧의 내부 보호 조치를 우회했다는 내용이 담긴 것으로 전해졌다. 데이터 스크래핑 기업들이 퍼플렉시티의 AI 기반 검색 시스템 '정답엔진(Answer Engine)'을 구동하는 데 필요한 데이터를 무단으로 가져갔다는 설명이다. 

레딧 일러스트. (사진=더버지)

해당 데이터 스트래핑 기업은 리투아니아의 옥실랩스(Oxylabs), 러시아의 AWM프록시(AWMProxy), 미국 텍사스의 서프API(SerpApi)다. 

앞서 레딧은 지난 6월에도 AI 스타트업 앤트로픽 상대로 유사한 소송을 제기한 바 있다. 이번 소송은 그 연장선상으로, AI 기업들의 데이터 사용 방식을 다시 문제 삼은 것으로 보인다.

레딧 관계자는 "지난해 퍼플렉시티 측에 데이터 무단 수집 중지·중단 요청서를 보냈다"며 "그럼에도 퍼플렉시티가 콘텐츠 인용 횟수를 40배나 늘렸다"고 지적했다. 이에 따라 레딧은 법원에 금전적 손해배상과 함께 퍼플렉시티가 웹페이지 데이터를 사용하는 것을 금지해 달라고 법원에 요청했다.

관련기사

벤 리 레딧 최고법무책임자(CFO)는 "AI 기업들이 양질의 인간 생성 콘텐츠를 확보하려는 경쟁 속에 산업 규모의 데이터 세탁이 일어나고 있다"고 비판했다.

이에 퍼플렉시티는 "정확한 AI로 사실적 답변을 제공한다는 점에서 원칙적이고 책임 있는 접근을 유지하고 있다"며 "개방성과 공익에 대한 위협을 용납하지 않을 것"이라고 반박했다.