올초 인공지능(AI)의 편향 및 개인정보 남용 논란이 나타나면서 서비스가 중단된 AI 챗봇 '이루다'가 2.0 버전으로 재출시될 예정이다.
이루다 개발사는 과거 문제됐던 부분들을 해결했다는 입장이지만, 수집 과정에서 위법성이 지적된 데이터를 다시 활용하는 것에 대해 비판적인 시선도 제기된다.
이루다 개발사 스캐터랩(대표 김종윤)은 이루다 2.0 공식 출시에 앞서 클로즈 베타 테스트를 내년 1월11일부터 진행한다고 밝혔다.
■대화 데이터 가명처리·문제 질의 차단…AI 윤리 원칙도 도입
이루다를 둘러싼 논란의 핵심은 서비스 구축에 활용된 데이터셋에 있다. 스캐터랩은 자사 앱 서비스인 '연애의 과학', '텍스트앳' 등에서 수집한 이용자의 카카오톡 대화 데이터 94억여건을 이루다 데이터셋으로 활용했다.
그 결과 이루다의 발화 내용에서 각종 혐오·차별 발언이 나타나 논란이 됐다. 이용자 데이터 수집 과정에서 이용자에게 데이터 활용 계획을 상세히 알리지 않았고, 가명처리를 제대로 하지 않은 것으로 드러나 개인정보보호법 위반에 따른 제재도 받았다.
회사가 깃허브에 공개한 이루다 AI 모델과 카톡 대화 문장에서 개인정보가 검출된 점, 만 14세 미만 아동 정보를 수집한 점, 성생활 등의 민감정보를 처리하면서 별도의 동의를 받지 않은 점도 제재 대상이 됐다.
스캐터랩은 과거 논란의 재발을 막기 위해 이루다 2.0 개발 과정에서 AI 기술 및 제품 개발 전반에 걸친 가이드라인인 AI 챗봇 윤리 준칙들을 수립했고, 이를 기반으로 서비스도 고도화했다고 강조했다.
우선 AI 고도화에 쓰이는 연구용 데이터베이스(DB)에 대해, 기존 DB에서 14세 미만 이용자 데이터와 삭제를 요청한 사용자 데이터를 제외한 뒤 가명처리했다. 개인정보보호법 상 가명정보 활용 요건에 해당하는 '과학적 연구' 목적에 한해 데이터를 활용했다는 설명이다.
이루다의 메시지를 도출하는 답변 DB는 AI 알고리즘이 생성한 문장 또는 회사에서 입력한 문장으로만 구성되게 했다. 여기에 개인정보 유출 가능성을 차단하기 위해 숫자, 영문, 사람 이름과 유사한 표현 등 개인정보처럼 보이는 내용이 포함되지 않도록 조치했다. 대화 시 특정 단어뿐만 아니라 문맥을 탐지해 선정적이거나 공격적, 또는 편향적 문장에 대응할 수 있도록 어뷰징 탐지 모델도 접목했다.
■"이루다 재출시? 손해배상 소송 신속 진행해야"
이루다 논란이 발생할 당시 개인정보 남용 관련 손해배상 소송을 제기한 이용자들은 이루다 재출시 소식에 불편한 심기를 내비쳤다.
해당 이용자들을 대리하는 법무법인 태림은 입장문을 통해 "해당 사건은 스캐터랩의 구체적, 실질적 답변이 제출되지 않은 채로 계속되고 있는 상황"이라며 "법원의 변론기일 지정을 기다려 왔으나, 스캐터랩이 서비스 재개를 공표함에 따라 피해자들은 추가적인 권리 침해를 우려할 수밖에 없는 상황"이라고 밝혔다.
이에 따라 이용자의 신속한 권리 보호를 위해 재판부에 변론기일을 지정해 달라는 신청서를 즉시 제출했다고 덧붙였다.
법무법인 태림은 "이루다 관련 심각한 개인정보 침해가 발생했다는 사실이 유관기관인 개인정보보호위원회를 통해 이미 확인된 상황"이라며 "과연 실제로 새로운 서비스에 활용된 데이터에 염결성이 존재하는지, 피해자들의 데이터가 활용되지 않은 것인지 등에 대한 의문을 감출 수 없다"고 주장했다.
법무법인 태림은 서비스 재개에 따른 추가 피해가 확인되는 경우에는 청구취지 확장 등 모든 방안을 검토하며 피해자들의 권리구제 및 보호, 추가 피해 방지를 위해 최선을 다할 예정이라고 강조했다.
이에 스캐터랩 관계자는 "개인정보 수집 절차에 대해 자사 앱 이용자에게 충분히 소통하지 못했다는 비판을 무겁게 받아들이고 있다"며 "당사는 적시에 답변서를 제출하는 등 소송 과정에 성실히 참여하고 있고, 향후 법원의 소송 진행에 따라 필요한 사항을 충실히 이행할 것"이라고 입장을 밝혔다.
이루다 2.0 클로즈 베타 테스트는 스캐터랩 내부 알파 테스트 및 외부 전문가 테스트 이후 진행되는 일반인 사용자 대상 의견 수렴 및 개선 과정으로, 1월4일까지 이루다 페이스북 페이지를 통해 이용 신청을 받아 약 3천명을 선정할 예정이다.
관련기사
- '이루다' 사례 피하려면…AI 윤리 자율점검표 등장2021.11.23
- "AI, 개인정보는 이렇게"…'이루다' 재발 막는다2021.05.12
- '혁신' 두 글자를 앞세워 무시해서는 안 되는 '원칙'2021.04.29
- [일문일답] "이루다, 아동·성생활 정보 불법수집…법 8건 위반"2021.04.28
베타 테스터로 선정된 사용자는 1월11일부터 약 3주간 이루다 2.0과 자유롭게 대화하면서 AI 챗봇이 대화 문맥을 이해하고 적절하게 답변하는지와 선정적, 공격적, 편향적인 단어나 문맥을 탐지해 대응하는지 등을 검토하게 된다. 단 이루다 2.0과의 대화 경험을 외부에 공개하지 않고, 스캐터랩에 대화 경험에 대한 의견을 제출하는 방식으로 진행된다.
스캐터랩은 클로즈 베타 테스트를 통해 AI 챗봇과의 대화 경험을 사용자 눈높이에서 바라보고, 사용자의 의견 및 개선 사항 등을 점검한 후 내년 이루다 2.0의 공식 출시 일정을 결정할 예정이다.