개인정보 비식별 조치하면 사실상 재식별 불가

3일 국회의원회관에서 비식별 조치 과정 시연

컴퓨팅입력 :2017/11/03 16:58    수정: 2017/11/03 17:09

손경호 기자

사용자의 개인정보에 대해서 그 사람이 누군지 모르게 비식별 조치를 할 경우, 또 다른 조치를 통해 이를 재식별할 가능성은 아주 낮은 것으로 나타났다.

3일 국회의원회관에서 열린 '빅데이터 활용을 위한 개인정보 비식별 조치 간담회'에서 비식별조치 기술위원회 박승준 박사가 이동전화 가입자 정보 및 미수납 데이터 필드(19개)로 58만명의 가상 개인정보에 대해 시연한 결과가 이 같이 나타났다.

이 시연은 그동안 비식별화된 정보들을 조합하면 그 사람이 누군지 다시 식별할 수 있다는 우려와 주장이 꾸준히 제기되면서 한국인터넷진흥원(KISA)이 직접 나서서 비식별화 조치를 취하는 과정과 결과를 보여주고, 의견을 듣기 위해 마련됐다.

시연에서 보여준 비식별화 처리된 정보는 사실상 재식별화가 불가능한 수준인 것으로 나타났다.

지난해 6월 말 범부처 합동으로 마련한 개인정보 비식별 조치 가이드라인에 따르면 비식별화된 정보는 개인정보라고 볼 수 없기 때문에 별도 적정성평가단의 검증을 거친 경우 용도를 제한해 사용자의 동의를 받지 않고서도 기업이나 기관 등에서 활용하는 일이 가능하다.

가상의 이동통신사 사용자들에 대한 개인정보를 비식별 처리한 결과.

이 가운데 핵심 쟁점이 된 것은 비식별 처리된 정보들을 조합하면 다시 개인정보로 바뀌어 문제가 될 수 있지 않냐는 우려다. 비식별된 정보가 재식별될 가능성이 있지 않냐는 지적이다.

시연에서는 실제 비식별화 조치가 이뤄지는 과정이 공개됐다.

여기에 사용된 가상 개인정보 원본 데이터에는 이동전화 가입자의 이름, 휴대폰 번호, 생년월일, 성별, 주소, 가입일자, 멤버십 등급, 태블릿PC보유여부, 결합상품가입여부, 납부방법, 당월납부요금, 연체금액, 월통화시간, 월통화빈도, 회선상태, 정지기간, 단말기가격이 포함됐다.

박승준 박사는 이중 비식별 사전 조치로 가입자 이름, 휴대폰 번호는 개인을 특정할 수 있는 '식별자'로서 역할을 하기 때문에 삭제했다. 다만 이를 활용하려는 기업, 기관의 목적에 따라 생년월일, 성별, 주소, 가입일자 등 정보는 비식별 조치를 한 뒤에 활용할 수 있도록 했다.

앞서 항목을 제외하고 멤버십등급, 태블릿PC보유여부, 결합상품가입여부 등 '속성자' 중에서도 기업, 기관이 활용하려는 본래 목적과 관련이 없는 경우에는 삭제하거나 알아볼 수 없는 다른 형태로 바꾸는 작업이 진행됐다.

당월납부요금을 예로들면 원본데이터에서 20원을 결제한 사람이 10명에 불과해 누군지 대략적으로 확인할 수 있는 경우 이를 '~1만원' 구간으로 범주를 바꿔 처리하는 방법으로 2만4천326명으로 늘어나게했다.

그 뒤에는 비식별 조치를 진행할 수 있는 대표적인 툴 중 하나인 'ARX익명화툴(ARX Anonymization Tool)'을 활용해 더 세밀하게 비식별화 조치를 진행했다. 이를 테면 1988년10월8일이라는 생년월일을 나이로 변환시키고, 상세주소는 인천, 경기, 강원 등으로 변환한다. 가입일자 역시 가입년도만 나오도록 바꾼다.

나이대도 실제 나이가 53세라면 비식별화 수준에 따라 50세~55세 구간 혹은 55세~60세 구간으로 변환해서 표시할 수 있다.

시연 결과에 대해 참석자들 사이에서는 오히려 기업, 기관이 빅데이터 분석에 활용하기 쉽지 않을 정도로 비식별화가 이뤄졌다는 의견이 나왔다.

SK텔레콤에서 관련 프로젝트를 진행한 김정선 박사는 "여러 기업들이 가진 이종데이터를 결합해 통계 방식이 아니라 표준 분포 모델을 활용한 새로운 서비스가 가능하겠구나 생각했지만 시연에서처럼 비식별 조치를 취해 나온 데이터의 품질이 미흡해 보인다"고 밝혔다. 보호에 치중되다 보니 오히려 기업들이 활용하기에 충분한 정보를 담고 있지 못할 수 있다는 의견이다.

오픈넷 박지환 변호사는 "실험실에서는 안전해 보이지만 현실에서 시민사회 입장에서는 비식별 조치가 이뤄진 정보가 뭐가 어떻게 쓰였는지 알기 어려운 블랙박스와 같다"며 "관련 내용을 투명하게 알려야한다"는 의견을 냈다. 실험실과 같은 시연 자체만 놓고 보면 비식별화 조치가 강력하게 이뤄졌지만 현실에서도 그럴 수 있을지에 대해서는 보다 검토가 필요하다는 설명이다.

관련기사

다만 비식별 조치를 취한 경우라도 내 정보가 어떤 형태로 활용되고 있는지에 대해서는 어떤 방식으로든 알려줄 필요가 있다는 주장이 나오기도 했다.

경인교대 심우민 교수는 "비식별 조치를 취한 경우 개인정보가 아니라 당사자의 동의가 필요없다는 점까지는 이해할 수 있지만 유럽 개인정보보호규칙(GDPR)이나 일본의 개인정보보호법에서처럼 적어도 내 정보가 비식별화돼서 쓰이고 있다는 점에 대해 동의를 구하는 것까지는 아니더라도 알고 있도록 해야한다"고 밝혔다.