개인정보 유출 논란 '이루다' DB 및 대화 모델 폐기

카카오톡 대화 남용 및 개인정보 유출 논란을 빚은 인공지능(AI) 챗봇 '이루다' 개발사 스캐터랩이 이루다에 활용된 데이터베이스와 관련 대화 모델을 폐기한다.

스캐터랩은 지난달 22일 정식 출시한 챗봇 이루다를 약 3주간 운영하던 과정에서, 이루다가 말하는 대화에 개인정보로 의심되는 정보들이 섞여있어 논란을 촉발했다.

스캐터랩은 11일 입장문을 통해 회사가 운영하는 또다른 서비스인 '연애의 과학'을 통해 수집된 이용자들의 카카오톡 대화를 챗봇 개발에 활용한 것이 맞다고 인정함과 동시에 이루다 서비스를 중단하겠다고 밝혔다.

이후 입장문 발표 사흘만인 15일 개인정보 유출 의혹이 점차 거세지자, 스캐터랩 측은 조사가 종료되는 즉시 이루다 DB와 대화 모델을 폐기할 방침이라고 밝혔다.

현재 개인정보보호위원회와 한국인터넷진흥원(KISA)이 이 사안에 대해 조사 중이다. 또한 연애의 과학 카카오톡 대화 제공자들은 카카오톡 오픈채팅방을 통해 개인정보 유출 사례를 공유하며 소송을 준비 중인 것으로 알려졌다. 그러면서 이들은 스캐터랩이 카카오톡 대화 데이터를 아예 삭제해야 한다고 주장해왔다.

스캐터랩은 "이용자들의 불안감을 고려하여 이번 인공지능 '이루다'의 DB 전량 및 딥러닝 대화 모델을 폐기하기로 했다"며 "기존 연애의 과학과 텍스트앳에서 이용자의 동의를 받고 수집되었던 기존 데이터는 데이터 활용을 원하지 않는 이용자로부터 신청을 받은 후, 해당 이용자의 데이터를 모두 삭제할 예정이고, 이는 향후 딥러닝 대화 모델에도 이용되지 않는다"고 말했다.

이어 "향후 신규 가입 및 서비스 이용시에는 개인정보 수집, 이용 동의 절차를 강화할 계획"이라며 "관련 후속 조치는 각 어플리케이션 공지를 통해 안내 받을 수 있다"고 덧붙였다.

회사는 연애의 과학 개인정보취급방침 내에서 이용했다고 주장하고 있으나 신규 서비스 개발에 활용한다는 문장 이외에 구체적으로 챗봇 개발에 활용하겠다고 명시하지 않아 이용자들의 반발을 사고 있다. 또한 제대로 비식별 처리가 되지 않는 사람 실명, 주소 등이 포함돼 개인정보 유출 의혹을 받고 있다.

스캐터랩은 이루다 DB가 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이뤄져 개인 식별이 가능한 데이터는 포함돼 있지 않았다고 주장했다. 또한 분명히 비식별화 된 데이터를 토대로 대화 패턴만을 학습하고, 인공지능은 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다고 강조했다.