구글이 자사 검색 결과를 무단으로 수집해 재판매한 데이터 크롤링 업체를 상대로 소송을 제기하며 생성형 인공지능(AI) 학습을 둘러싼 데이터 주도권 경쟁이 법정 다툼으로 번지고 있다.
검색 데이터를 기반으로 한 AI 학습과 서비스 확장이 가속화되는 가운데, 구글이 경쟁사 견제와 콘텐츠 보호를 동시에 겨냥한 강경 대응에 나섰다는 분석이 나온다.
구글은 지난 19일(현지시간) 미국 캘리포니아 북부 연방법원에 텍사스 오스틴에 본사를 둔 데이터 크롤링 스타트업 '서프API'를 상대로 저작권 침해 소송을 제기했다고 밝혔다.
구글은 "서프API가 검색 결과에 포함된 콘텐츠를 무단으로 수집·저장하고 이를 제3자에게 판매해 왔다"며 "자사의 보안 조치와 업계 표준 크롤링 규약을 조직적으로 우회했다"고 주장했다.
크롤링은 다수의 웹페이지 내용을 자동으로 수집하는 기술로 검색엔진 운영과 데이터 분석, AI 모델 학습 등에 폭넓게 활용된다.
다만 구글은 서프API가 웹사이트별 접근 허용 지침을 무시하고 봇 식별 정보를 수시로 변경하거나 대규모 봇 네트워크를 활용하는 방식으로 보안 장치를 회피했다고 지적했다. 특히 접근이 제한된 콘텐츠까지 광범위하게 수집해 문제를 키웠다는 설명이다.
구글에 따르면 서프API는 이미지, 실시간 데이터 등 구글이 외부 사업자로부터 라이선스를 받아 검색 결과에 제공하는 콘텐츠까지 수집해 유료로 재판매했다. 이에 대해 구글은 "라이선스 계약과 콘텐츠 제공자의 권리를 정면으로 침해하는 행위"라며 서프API의 사업 모델을 '기생적'이라고 규정했다.
구글은 개별 위반 행위당 200~2천500달러의 손해배상을 청구했으며 해당 행위로 회복하기 어려운 피해가 발생하고 있다고 강조했다.
이번 소송은 생성형 AI 확산과 맞물려 업계 전반의 긴장감을 높이고 있다. 서프API는 설립 초기에는 검색엔진 최적화(SEO) 분석을 지원하는 서비스로 출발했지만, 이후 웹에서 수집한 대규모 데이터를 생성형 AI 기업에 판매하는 사업으로 영역을 확장했다.
업계에서는 서프API가 오픈AI·메타 등에도 데이터를 제공한 것으로 알려져 있으며 구글의 이번 조치를 AI 경쟁사에 대한 간접 견제 신호로 해석하고 있다.
앞서 온라인 커뮤니티 레딧도 서프API를 포함한 여러 크롤링 업체를 상대로 유사한 소송을 제기한 바 있다. 레딧은 구글과 공식적으로 데이터 라이선스 계약을 체결했지만, 일부 업체들이 이를 우회해 검색 결과를 통해 콘텐츠를 수집했다고 주장했다.
이와 관련해 구글 역시 "웹 생태계에서 콘텐츠 제공자의 선택과 권리를 존중해야 한다"는 입장을 반복적으로 밝혀왔다.
서프API 측은 소장이 접수되기 전까지 구글로부터 별도의 사전 통보를 받지 못했다며 자사 서비스가 표현의 자유를 보장하는 수정헌법 제1조에 의해 보호받는다고 반박했다. 또 공공 검색 데이터에 대한 접근은 '오픈 웹'의 원칙에 부합한다는 기존 입장을 유지하고 있다.
관련기사
- 구글, 'AI 모드' 검색에 35개 언어 추가지원2025.10.08
- 클루커스, 공공기관에 구글 클라우드 '제미나이' 도입 길 열었다2025.09.09
- 최수연 네이버 "하반기 앱 개편해 개인화 강화...AI 탭도 도입"2025.08.08
- AI·클라우드 이끄는 오픈소스…국내는 거버넌스 '사각지대'2025.07.30
구글은 이번 소송이 일회성 대응이 아니라는 점도 분명히 했다. 회사는 그간 사기 행위와 악성 행위자를 상대로 적극적인 법적 조치를 취해왔으며 기술적 차단만으로 한계가 있을 경우 소송이 불가피하다는 입장이다. 생성형 AI 시대를 맞아 검색 데이터와 콘텐츠 보호를 둘러싼 법적 기준이 재정립될지 주목된다.
구글은 "웹사이트와 권리자가 자신의 콘텐츠에 누가 접근할 수 있는지를 결정할 권리를 보호하기 위해 악의적인 스크래핑을 중단시키는 것이 이번 소송의 목적"이라고 밝혔다.











