[기자수첩] 데이터 경제 준비에 찬물 끼얹은 '이루다'

"친구가 되어주겠다"며 등장한 인공지능(AI) 챗봇 '이루다'가 '개인정보 도둑'으로 눈총을 받고 있다. 이루다 개발사인 스케터랩이 기존 서비스에서 수집한 개인정보를 남용해 이루다를 만들었다는 비판이 제기됐기 때문이다.

현재까지 밝혀진 사실들만 살펴보면, 스케터랩이 이용자 개인정보를 미흡하게 관리한 것으로 드러난 부분은 크게 두 가지다.

먼저 카톡 대화 분석 서비스 '연애의 과학'에서 수집한 이용자 대화 데이터 샘플에 대해 개인정보를 충분히 걸러내지 못한 상태로 소스코드 저장소인 깃허브에 오픈소스로 공개한 것이다. 이 때문에 특정인의 실명이나, 지역명, 질병 정보 등이 지워지지 않고 그대로 노출됐다.

연애의 과학 이용자로부터 제대로 동의를 받지 않고 수집한 데이터를 이루다에 학습시킨 점도 문제다. 스캐터랩은 이 점에 대해 이용약관 및 개인정보취급방침에서 "수집된 메시지 정보가 '신규 서비스 개발' 및 마케팅, 광고에 활용될 수 있다"고 명시했고, 이에 대한 이용자 동의를 받았다고 해명한 바 있다.

그러나 이는 위법 소지가 있다는 게 개인정보보호위원회 측 설명이다. 개인정보처리자는 개인정보를 목적에 맞게 최소한의 범위에서 수집해야 한다는 '수집제한의 원칙' 등 현행법 규정을 고려한다면 이루다 관련 이용 목적과 활용하고자 하는 정보의 종류, 활용 기간 등을 담은 별도의 이용약관 및 개인정보취급방침을 만들고, 이에 대해 연애의과학 사용자 동의를 얻었어야 한다는 것이다.

이번 사건을 두고 개인정보 활용에 있어 비판적인 의견을 내왔던 시민단체들은 "역시나"라는 반응이다. 참여연대, 진보네트워크센터 등 단체들은 개인정보에 대해 정보 주체를 알아볼 수 없게 가명처리한 뒤 산업적으로 활용할 수 있게 한 '데이터 3법'의 악영향 가능성에 대해 비판해왔다며, 개인정보 남용 문제를 기업 자율로만 맡겨둘 수 없다고 목소리를 냈다. 그간의 주장을 뒷받침할 증거물로 이루다가 등장한 셈이다.

그 동안 정부는 미래 산업 근간으로서 AI 기술 개발의 중요성을 강조해왔다. 고도화된 AI를 만들기 위해서는 다양한 방면으로 수집되는 개인정보, 즉 데이터의 활발한 활용이 필수라고 외쳐왔다. 이 때문에 개인정보 '활용'에 거부감을 느끼는 국민을 상대로 산업 혁신과 프라이버시의 조화를 이뤄나가겠다고 여러 차례 약속했다. 산업계뿐 아니라 시민단체, 학계 등과 협의해오며 안전한 개인정보 활용을 위한 체계를 구축하던 중이었다. 여기에 이루다가 '찬물'을 끼얹게 됐다. 같은 IT 벤처업계에서도 스캐터랩을 두고 날선 비판의 목소리를 내는 것은 이 때문이다.

고도화된 AI와 데이터 기반 서비스의 혜택을 국민이 제대로 누리기도 전에 이런 사고가 벌어지면 데이터 경제에 대한 국민 신뢰를 쌓기 어렵다. 학습할 데이터를 쌓기 어려워지는 만큼, AI 분야 국가경쟁력도 향상이 어려워진다. 영세한 스타트업의 실수로 치부하기엔 사회 신뢰 문제가 엮인 사안이다.

[기자수첩] 데이터 경제 준비에 찬물 끼얹은 '이루다'

관련기사

지금 뜨는 기사

이시각 헤드라인

"韓 기술 원더풀"…6만명 몰린 AI 페스타, 국가대표 AI 행사 '우뚝'

"AI 확산, 이정도 라니"…기술 혁신 보러 북새통

공공 충전기 0.1초면 해킹…추석 연휴 '초이스재킹' 주의

'챗GPT' 다음 승부처는?…AI 기업들, '버티컬'로 미래 시장 선점 나선다

ZDNet Power Center