네이버, AI 음성수집 논란 해명...카카오 등 경쟁사는?

“7일 후 비식별화 조치...전사 작업은 타사들도 비슷”

인터넷입력 :2019/09/03 18:26    수정: 2019/09/04 10:33

네이버가 인공지능(AI) 서비스 '클로바'의 음성정보 수집에 따른 이용자 사생활 침해 우려 보도에 공식 반박했다.

AI 플랫폼 클로바 서비스의 품질 측정과 제고를 위해 호출이 일어난 이후 이용자의 음성 데이터를 저장하지만, 이후 적법한 절차에 따라 비식별 처리하고 파기·삭제한다는 것이다.

또 네이버는 클로바와 유사 서비스를 제공하는 카카오나 애플, 구글 등도 음성 서비스 품질을 높이기 위한 음성 데이터 수집 작업 등은 비슷하다고 설명했다. 실제로 카카오도 사용자의 음성 정보를 일부 수집하고, 서비스 품질 고도화를 위한 작업에 사용했다. 보안을 위한 비식별화 조치도 이뤄졌다.

네이버는 3일 ‘네이버 다이어리’ 공지문을 통해 AI 서비스 이용자 사생활 침해 우려에 대한 설명문을 올렸다.

이는 네이버가 자사 AI 서비스 클로바와 이용자가 나눈 대화 내용을 녹음한 뒤, 협력사 직원을 통해 녹취하고 있다는 한 언론사 보도에 대한 해명이다.

회사는 “네이버는 클로바 이용약관에 명시한 바와 같이, AI 플랫폼 클로바 서비스의 품질 측정 및 제고를 위해 이용자가 호출어를 통해 입력하는 데이터를 저장하고, 이후 비식별 처리 및 파기, 삭제하고 있다”고 밝혔다. 또 “클로바를 호출하지 않은 상태에서는 어떤 대화 내용도 수집하지 않는다”고 덧붙였다.

네이버는 이렇게 저장한 데이터를 7일 후 음성과 발화자의 연결고리를 끊는 비식별 처리를 진행한다고 설명했다. 비식별 처리 목적은 ‘누구의 음성인지’를 식별할 수 없게 하기 위해서다. 회사에 따르면 7일 후 비식별 조치는 업계 최단 기간이다.

이후 네이버는 비식별 처리된 음성 명령 전체 가운데 1% 미만에 한해 직접 듣고 텍스트화 하는 전사(말소리를 문자로 옮겨 적음) 작업을 진행한다.

이에 대해 회사는 “이용자가 클로바를 호출했을 시 작업을 제대로 수행하고 있는지를 확인하고, 이를 기반으로 서비스 품질을 높이기 위한 작업”이라면서 “국내외 AI 서비스를 제공하는 업체들은 비슷한 작업을 진행한다”고 해명했다.

아울러 “AI 스피커를 이용해 결제 절차가 포함된 쇼핑, 주문 등의 기능을 제공할 경우에는 해당 음성 명령에 한해 고객 문의 응대나 분쟁 조정 등을 목적으로 최소한의 기간 동안 계정과 연동해 보관한다”고 설명했다.

특히 네이버는 전사 작업 담당 자회사 직원과도 별도의 보안계약서를 작성, 작업자에게 전사할 음성의 내용을 음성명령 단위로 쪼개 배분하기 때문에 사생활 침해가 발생할 우려가 없다고 강조했다.

이 밖에 네이버는 앞으로 이용자들이 음성명령어의 저장 허용 여부를 직접 결정할 수 있는 ‘옵트 아웃’ 기능을 국내 기업 중 최초로 도입할 계획이라고 알렸다. 나아가 사생활 보호 강화를 위해 연합학습, 비감독학습 등에 대한 연구를 진행하는 등 다양한 조치를 수행할 계획이라고도 덧붙였다.

클로바 이용약관

참고로 구글은 음성정보 전체를 보관하며, 이용자가 직접 삭제하지 않는 경우 무제한 보관한다. 이용자 통제권을 제공하는 대신, 통제권 행사하지 않은 경우 무제한 보관 및 활용하는 것이다. 애플은 음성정보와 이용자 연계값을 음성정보 수집 6개월 시점에 삭제한다. 음성정보는 2년간 보관 한다. 이용자 통제권을 제공하지 않는 대신, 음성정보 보호수준을 높인 것으로 보인다.

카카오 역시 음성인식 개선 등 서비스의 품질 향상을 위해 음성 명령 전체 가운데 무작위로 0.2% 미만의 음성 데이터를 추출한다. 또 협력사 리뷰자 전사 작업을 실시한다. 단, 개인정보에 해당되는 내용은 자동 마스킹 처리된 후 진행되며, 전사 작업에 사용되는 음성 또한 변조 등의 조치를 통해 비식별 처리한다. 전사 작업에 쓰이지 않은 음성데이터의 경우는 비식별조치 되지 않으며, 이는 사용자가 회원탈퇴할 경우 바로 삭제된다.

관련기사

카카오는 “음성정보를 개인정보에 준하게 엄격하고 철저히 관리하고 있다”면서 “이용자의 다른 개인정보와 음성정보는 분리보관하고 있다. 이용자가 서비스를 탈퇴할 때 별도의 식별자를 통해 즉각 개인정보(음성정보)를 파기하고 있다”고 밝혔다.

이어 “모든 개인정보는 ‘서비스 탈퇴 시 파기’가 원칙”이라면서도 “비식별화해서 보관할 경우, 서비스를 탈퇴해도 24개월 동안 관련 정보가 보관되며 파기되지 않는다”고 덧붙였다.