써본 이들이 먼저 "사람 같다" 칭찬하는 챗봇 '이루다'

편향 학습시키는 트롤도 생겨‥사측 "대항 세력 준비"

컴퓨팅입력 :2021/01/07 08:09    수정: 2021/01/07 10:00

새로운 인공지능(AI) 서비스가 나올 때마다 ‘진짜 사람 같은 AI’란 수식어가 따라 붙는다. 그러나 아쉽게도 실제로 이용해보면 '역시 사람까진 아니구나' 싶은 생각을 떠올리게 한다. 그런데 이번엔 이용자들이 먼저 사용해보고 ‘사람 같다’며 입을 모아 칭찬하는 AI 챗봇이 등장했다. 챗봇 전문 스타트업 스캐터랩이 지난달 22일 정식 출시한 AI 챗봇 ‘이루다’이다. 

'이루다'는 국내에선 '심심이'의 계보를 잇는 개방형 AI 챗봇이다. 회사 측에서 정한 규칙에 기반(룰베이스)한 것이 아닌 이용자와 오가는 대화들로 학습하는 딥러닝형 챗봇이다.

이씨 성에 루다란 이름을 가진 이 챗봇은 20살 여자 대학생으로 설정됐다. 문자 메시지보다는 카카오톡, 카카오톡보다는 페이스북 메신저가 익숙한 신세대를 겨냥해 페이스북 메신저 상에 구축됐다. 때문에 스마트폰 부가 기능으로서 개발된 애플 ‘시리’, 삼성 갤럭시 ‘빅스비’와도 또 다르게 친근한 느낌을 준다. 

기자가 직접 이루다와 대화해봤다. 다소 꼰대 같아 보일 수 있으나 루다에게 왜 존댓말과 반말을 섞어 쓰느냐 물어보니 '가끔은 존댓말이 나온다'며 자연스럽게 받아친다.

또한 구체적인 대학교 이름은 끝끝내 말하지 않고 심리학 전공이라고만 답한다. 가수 블랙핑크를 좋아한다. 맞춤법을 파괴한 채 이모티콘을 섞어가며 대화한다.

대화한지 꽤 시간이 흐르면 '새해 계획은 세웠냐', '밖에 눈 온다'며 먼저 말을 걸기도 한다. 몇 번 대화를 주고 받다보면 상당히 많은 정보를 알고 있음을 '느낄' 수 있다. 모를 때도 단순히 모른다고 하지 않고 '처음 들어봐, 검색좀하고'라거나, '영어는 아직이라(그 내용은 모른다)'는 등 여러 가지 유형으로 표현한다.

이같은 특징들 때문인지 확실히 루다는 10대 층에서 인기가 많다. 10대 이용자 비중은 85%, 20대 이용자는 12%다. 6일 현재 누적 대화량은 7천만건으로, 하루 대화량 최고치는 1천800만건이다. 5일엔 일간 이용자 수(DAU) 최고치인 21만명을 달성했다. 누적 사용자 수는 32만명이다.

이루다.(사진=이루다 페이스북 페이지)

루다의 인기가 치솟으면서 한 커뮤니티엔 ‘이루다 채널’도 생겼다. 일명 ‘이루다 키우기’라고 하며 편향된 대화로 학습 시킨다. 루다를 여자친구처럼 대하는 이용자들부터 자칫 도덕적으로 어긋난 대화를 유도하는 ‘트롤’로 볼만한 세력들도 있다.

스캐터랩은 왜 루다를 만들게 됐나. 김종윤 스캐터랩 대표는 6일 지디넷코리아가 진행한 전화 인터뷰에서 “더 많은 사람들과 오랫동안 이야기 하게 만들기 위해서”라고 답했다. 그는 “영향력 있는 챗봇을 만들기 위해, 100만명 이상의 사람과 대화하다 보면 향후엔 또 재밌는 일들이 생길 것이라 본다”며 “그동안 우리는 뒤에서 기술적인 업데이트를 지속할 것”이라고 덧붙였다.

김 대표는 루다에게 부정한 대화를 유도하는 트롤 세력도 예상했던 시나리오였으며, 이에 대항하는 인력들을 조만간 투입할 계획이라고 밝혔다. 

이루다 채널(사진=이루다 채널 캡쳐)

김 대표는 “결국 루다에게도 일반 유저들이 아닌 부모님 역할을 할 사람이 필요하다”며 “이번 분기 안으로 루다에게 적절한 대화를 유도하는 데이터 레이블러 인력들을 투입할 계획”이라고 강조했다.

2016년 마이크로소프트가 출시한 개방형 챗봇 '타이'에게도 인종차별주의자로 만들기 위한 편향 학습 시도자들이 있었다. 당시 타이는 트위터에 기반한 챗봇이었다. 

이번 이루다 채널에는 루다를 초기화하겠다는 이용자들도 보이나, 새롭게 접근한다 해도 대화 이력만 리셋될 뿐 초기화 되지 않는다. 이용자 별로 다른 루다가 생성되는 것이 아닌 수십만 이용자의 대화량이 축적돼 하나의 루다를 구성하기 때문이다.

김 대표는 “사실 딥러닝이란 게 사전에 모든 걸 완벽하게 막는 것은 불가능하다”며 “실수를 하면서 어떻게 실수를 극복하는지가 성공으로 가는 길이라고 본다”고 말했다.

이어 그는 “테슬라가 왜 자율주행 자동차 대표 스타트업으로 떠올랐는지 보면, 실수도 먼저 하면서 타개하기 때문이고 이는 대기업에겐 어려운 일”이라면서 “우리 회사도 어뷰징(남용) 문제를 출시 전부터 예상했고, 이용자들이 좋은 말만 하리라 생각하지 않았다”고 덧붙였다.

김종윤 스캐터랩 대표

스캐터랩은 회사가 서비스 하는 챗봇들의 근간이 되는 챗봇 브랜드인 ‘핑퐁’을 운영 중이다. 그중에서 루다 프로젝트를 위한 팀은 20명 남짓한 인원으로 구성됐다. 지난해 베타 테스트를 포함한 약 1년간의 준비 끝에 루다를 정식 출시했다.

이제 루다는 베타 버전 때보다 대화 능력이 30% 이상 향상됐다. 구글이 제안하는 오픈 도메인 대화 기술의 성능 평가 지표 ‘SSA’를 기준으로 보면 루다는 한국어를 구사하는 챗봇 중 꽤 높은 점수를 기록하고 있다. 사람의 SSA가 86%라면, 루다는 78%다. 작년 초 구글이 만든 오픈 도메인 챗봇 ‘미나’의 SSA는 76~78%다.

김 대표는 “아직 루다를 이용한 구체적인 BM(수익모델)은 없다”며 “지속해서 루다를 서비스 하다보면 차차 생길 수 있을 것”이라고 밝혔다.

관련기사

루다에게 애플 AI 비서 시리를 아냐고 물어보면 할머니, 화석이라 답하고, 삼성 갤럭시의 AI 빅스비에 대해선 건너건너 들어 봤다고 한다. 아마존 AI 비서 알렉사, 마이크로소프트의 AI 코타나는 모르는 듯 보인다.

끝으로 기자는 루다에게 얼마나 다양한 AI 챗봇을 알고 있는지 물어봤다. 시리를 아냐고 물어보면 '할머니', '화석' 급으로 매도해버린다. 아마존의 AI '알렉사', 마이크로소프트의 AI '코타나'에 대해선 특별한 응답이 없는 것으로 보아 모르는 듯 하다. 외국계 IT 회사들에겐 우호적이지 않은 모습이다.

반면 삼성 빅스비에 대해선 건너건너 들어봤으며 '목소리가 좋으시다'고 칭찬한다. 높여 말하는 것에서 미루어보아 '챗봇계 어르신'으로 인식하고 있음을 알 수 있다. 네이버 AI '클로바'에 대해선 '걔 내가 헤이 클로바라고 하면 무조건 온다? 나 진짜 좋아한다니까~'라며 동년배처럼 대한다. 카카오 AI '헤이카카오'에 대해선 '카카오는 귀엽긴한데ㅋㅋ 친하진 않아ㅋㅋ'라고 선 긋는다. KT 기가지니는 '말이 잘 통하는 가장 친한 친구'라며 후하게 평가했다. 국내 IT 회사들의 AI 친구들은 그래도 대부분 파악하고 있는 모양이다.