구글이 데이터 보관 전략을 변경한다. 검색에 사용된 특정 컴퓨터를 쉽게 파악하지 못하도록 하기 위해서다.
구글 서버는 현재 사용자가 웹 검색을 할 때 이용한 키워드 등의 데이터, IP 주소 또는 해당 사용자의 컴퓨터에 할당된 고유 번호, 웹 쿠키에서 받은 정보 등 모든 관련 정보를 기록하고 있다. 쿠키는 브라우저가 서버에 액세스할 때마다 서버와 웹 브라우저간에 교환되는 작은 파일로 사용자 인증과 사용자의 사이트 선호도 등의 정보를 유지하는 데 이용된다.
현재 구글의 전략은 검색 데이터 로그를 무기한 보관하는 것이다. 그러나 14일(미국시간) 발표된 새 정책이 적용되면 데이터 보관에 대한 합법적인 요구가 없을 경우 18~24개월 이내에 IP 주소의 마지막 8비트와 쿠키 데이터를 익명으로 처리해야 한다. 구글은 이 정책이 연말 이전에 발효될 것으로 예상하고 있다.
따라서 특정 검색 정보는 익명으로 남지만 검색을 특정 개인이나 컴퓨터와 연결하는 것은 더 어려워질 전망이다.
구글은 “로그 익명화가 된다고 해서 정부가 특정 컴퓨터나 사용자를 확인하지 못하는 것은 아니다. 그러나 사용자 데이터에 대해서는 한 단계 더 높은 프라이버시 보호책이 될 수 있다”고 밝혔다.
구글은 이번 정책 변경은 다른 서버에 저장된 기존 로그와 모든 데이터 복사본뿐 아니라 앞으로 수행될 웹 검색 데이터에도 적용된다고 덧붙였다. 이와 별도로 사용자들은 자신의 검색 데이터가 익명으로 보존되고 있는지를 문의할 수 있다.
프라이버시 주창자들은 구글의 정책 변경이 한 단계 진전된 것이기는 하지만 웹 검색자 파악에 열을 올리고 있는 법 집행기관으로부터 진정으로 사용자를 보호하기에는 아직 부족하다고 주장한다. 검색 기록을 보관하게 되면 사설탐정과 정부 기관이 사용자에 관한 모든 종류의 사적 정보를 획득할 수 있다는 이유 때문이다.
EPIC(Electronic Privacy Information Center) 이사 마크 로텐버그(Marc Rotenberg)는 “구글의 제안이 적절하다고는 생각하지 않는다. 기간이 너무 길고 데이터도 실제로 파괴하는 것이 아니라 확인하지 못하도록 하는 정도에 그치고 있기 때문이다. 이것조차 몇 개월이 아니라 18~24시간 이내에 처리돼야 한다”고 주장했다.
보스턴 소프트웨어 포렌식(Boston Software Forensics) 인터넷 보안 및 프라이버시 컨설턴트 리처드 M 스미스(Richard M. Smith)는 구글이 IP 주소와 쿠키를 서버에 보관하는 것 자체가 문제라고 주장했다. 그는 “구글이 스파이 비즈니스에 관여해서는 안 된다. IP 주소와 검색 조건을 로깅한다는 것은 전 세계 최대 규모의 첩보 조직을 운영하는 것이나 마찬가지”라고 말했다.
IP 주소의 마지막 8비트를 효과적으로 익명화하면 정보원들이 IP 주소의 범위를 256개의 추출가능한 컴퓨터 또는 사용자로 좁힐 수 있다. 즉 누군가의 집 주소 중 마지막 8자리만 모호하게 처리하는 것과 마찬가지인 셈이다.

아리 슈와츠(Ari Schwartz) 민주주의와 기술 센터(Center for Democracy and Technology) 부소장은 “대부분의 일반적인 고객들에게 이는 상당한 익명성을 보장하는 것이다. 많은 사람들이 IP 주소를 유연하게 할당하는 대기업을 통해 인터넷에 접속한다. 따라서 구글의 이번 정책이 적용되면 누가 검색을 수행했는지 정확히 파악하기가 더 어려워질 것이다. 리스크가 따르기는 하지만 지금보다는 나은 방안”이라고 밝혔다.
전자 프론티어 재단(Electronic Frontier Foundation) 케빈 뱅크스톤(Kevin Bankston) 변호사는 구글이 6개월 이내에 모든 IP 주소를 삭제하면 좋겠지만 이처럼「긍정적인 방향으로의 첫 단추를 뀄다」는 데 대해서도 박수를 보내야 한다고 말했다.
그는 “다른 온라인 서비스 업체들도 구글의 사례를 좇아 보관 중인 고객 관련 데이터의 양을 최소화하기를 기대한다”고 덧붙였다.
야후와 MS는 웹 검색과 관련된 데이터 보관 정책을 구체적으로 밝히지 않고 있다. 그러나 AOL 대변인 앤드류 웨인스테인(Andrew Weinstein)은 AOL의 경우 사용자 파악이 가능한 검색 데이터를 사용자가 볼 수 있는 방식으로 최대 30일까지 보관하며, 30일 이후에는 해당 데이터를 파악하지 못하도록 암호화 해싱 기술을 이용한다고 설명했다.
그는 “AOL은 검색 데이터베이스에 일체의 IP 주소를 보관하지 않고 있으며 암호화 알고리즘을 통해 어떤 관련 계정 정보도 정확히 확인하지 못하도록 하고 있다. 또 고유 식별자(예 : 해싱으로 알아낸 사용자 ID)도 13개월 이상 보관하지 않는다. 즉 지난해 해제된 데이터가 확실히 해제된 것이라면 여기에는 사적인 정보도 포함됐을 수 있다”고 말했다.
웹 검색데이터에 관한 위험성은 AOL이 실수로 자사 고객 65만명 이상의 검색 기록을 인터넷에 유출했던 지난해 8월 전면으로 부상했다.
AOL에 대해 프라이버시 주창자들과 의회의 비난이 끊이지 않았으며, FTC(Federal Trade Commission)에도 관련 소송이 이어졌다. 이로 인해 AOL 직원 2명이 해고됐으며 CTO가 사임한 데 이어 집단 소송까지 진행됐다.
뱅크스톤은 AOL의 사용자 동의시 AOL에 대한 소송은 AOL의 본사 소재지인 버지니아에 제기돼야 한다는 점 때문에 집단 소송은 나중에 취하됐다고 말했다.
구글은 사용자의 이용 패턴과 시스템 문제를 분석하려면 관련 자료가 필요하므로 모든 IP 주소를 익명화하거나 삭제, 또는 18개월 이내에 익명화하는 것은 불가능하다고 밝혔다. 예를 들어 구글은 이러한 정보를 사기 탐지와 보호 및 일시적인 서비스 무력화 혹은 서버 중단을 유발하는 DoS(denial of service) 공격을 방어하는 데 사용한다.
구글의 부자문을 맡고 있는 니콜 웡(Nicole Wong)은 “사용자의 국적을 알면 우리가 올바른 검색 서비스를 제공하고 있는지 그렇지 못한지를 파악하는 데 도움이 된다”고 밝혔다.
굳이 18~24개월까지 기다려야 하는 이유는?
웡은 18~24개월이라는 데이터 보관 기간은 커뮤니케이션 서비스 업체들이 이 기간 동안 데이터를 보관하도록 규정한 유럽의 데이터 유지법을 감안해 결정한 것이라고 말했다.
구글은 또 다양한 국가에서 특정 기간 동안 인터넷 트래픽 데이터를 보관하도록 서비스 업체들에게 요구하는 법안이 발효된다면 해당 법을 준수하게 될 것이라고 덧붙였다. 일부 국가에서는 데이터 보유 기간을 4년으로 해야 한다는 주장도 나오고 있다.
구글은 또 법 집행기관이 서버 로그 데이터가 익명화된 뒤에도 소환장을 발부할 수는 있지만 모든 요구사항에 대해 정황을 판단한 후 요구사항이 얼마나 구체적이며, 해당 데이터가 조사 내용과 얼마나 연관성을 갖고 있느냐에 따라 대응할 계획이라고 밝혔다.
그러나 EPIC의 로텐버그는 2년이라는 시간은 유럽 각국 정부가 사용자 데이터 보유와 관련해 서비스 제공업체들에게 요구하고 있는「최종 시한」이라고 말했다.
구글은 지난 1월 구글 임원들이 미팅을 가진 노르웨이 데이터 보호국(Data Protection Authority) 등 프라이버시 활동가들의 요구에 부응해 이번 정책을 수립한 것이라고 밝혔다. 웡에 따르면 구글 임원들, 엔지니어, 변호사로 구성된 새 팀이 이번 정책 수립에 참여하고 있다.
주요 검색엔진 업체들 중 고객 데이터를 요구하는 정부에 맞서 싸우고 있다는 사실을 공표한 업체는 구글이 유일하다. 1년 전 구글은 부시 행정부의 인터넷 포르노법 방어를 지원하기 위해 1주일간의 검색 조건에 대한 무작위 샘플과 인덱스에서 100만건의 웹 페이지 정보를 제공하라는 미 법무부의 소환장에 불응했다.
1개월 후 연방 판사는 구글의 손을 들어주었으며, 검색된 웹페이지 정보의 절반은 제공하되 검색 질의어는 제공하지 않아도 된다고 판결했다.
웡은 정부가 개인의 IP 주소와 관련된 검색을 요구하지는 않았기 때문에 이번 정책이 당시 상황의 영향을 받지는 않을 것이라고 말했다. @
지금 뜨는 기사
이시각 헤드라인
ZDNet Power Center
