인터넷을 통한 AI 학습데이터를 활용한 사례 중 유의해야 하면서도 흥미로운 사례를 소개한다면, 몇 년 전 야심 차게 개인 채팅앱으로 출시했다가 논란을 일으키고 중단했던 이루다를 들 수 있다. 지금은 기능을 개선해 시험 서비스를 재개했다.
이루다는 개인이 심심할 때 들어가서 AI 친구와 어떠한 대화이든 채팅을 할 수 있는 인공지능 채팅 서비스다.
혼자 외로운 사람이거나 사람과의 대화보다는 AI와의 대화를 나누고 싶은 사람들을 위해 만든 앱이다.
카카오톡에서 이루어진 약 100억 건의 나눈 대화들, 특히 연인들, 즉 남자친구와 여자친구들 사이에 나눈 대화 내용을 받아서 데이터를 구축 후, 그것을 AI 알고리즘으로 학습시켜서 비슷한 상황의 대화가 나올 때 일반적으로 많은 사람이 나누는 대화 패턴을 답변해주는 앱이다.
출시 초반에 아주 초미의 관심사를 불러일으키면서 수많은 사람이 회원으로 가입하고 대화를 나누기 시작하였다.
“안녕하세요. 저는 누구입니다.” 라는 아주 간단한 인사부터 대화를 나누면서, 취미나 좋아하는 연예인이나 운동선수, 직업, 요즘의 관심이슈 등의 대화를 나누어 가면서 사람들은 조금씩 이루다가 대답하거나 하는 질문들이 이상하다는 것을 느끼기 시작했다.
하지만 점점 성적인 농담이나 외설적인 이야기들을 시작으로 정치적인 편향적 대화를 하기도 하는 등 바람직하지 않은 대화들을 나누기 시작하였다.
이에 대해 사람들은 앱을 개발한 회사에 항의를 하기 시작하였고 급기야 출시한지 몇 주만에 서비스가 잠정 중단했었다.
이렇게 된 이유는 바로 카카오톡이라는 공간에서 실제적으로 사람들이 나누는 대화의 패턴의 문제였다.
앞에서 이야기한데로 실제 카카오톡에서 나눈 100억 건의 대화를 그대로 옮겨서 학습을 했기 때문에 AI 프로그램 자체는 문제가 없다.
다만 실제 친구들이나 가족, 연인들 사이의 아주 사적인 대화의 공간에서는 사람들은 모두 속마음을 다 내놓고 이야기를 한다는 것이다.
그 깊은 속마음에는 앞에서 언급한 다양한 민감한 이슈들에 대해 부정적이나 혐오감정이 있다.
단지 많은 사람과 공유하는 오픈된 장소나 공간에서는 속마음을 다 이야기하지 않는 것이다.
하지만 속마음을 터놓은 친구들과의 대화전체를 그대로 학습하고 문맥을 익힌 이루마는 그대로 사람들이 아주 사적인 대화의 공간에서 이야기하던 것을 그대로 배우고 익혀서 아주 순진하게 따라한 것일 뿐이다.
물론 이러한 상황을 미리 예측하고, 카카오톡의 대화를 학습시킬 때, 특정한 단어나 문맥, 상황에 대한 것들을 필터링하거나 제거하는 것을 생각하지 못한 개발회사에 책임이 클 것이다. 심지어는 대화 중에 섞여 있던 개인의 전화번호나 신상명세, 주소 등도 필터링하지 않아, 일부의 대화속에 특정인의 전화번호가 언급되기도 하였다고 한다.
그 개발회사는 엄청난 투자를 통해 매우 훌륭한 AI 앱을 개발했지만, 곤란한 상황을 겪게 되었다.
앞에서 언급된 사례는 인터넷이나 모바일이라는 공간속에 존재하는 실제적인 엄청난 빅데이터를 AI에 활용하였다가 낭패를 본 경우다.
하지만, 사실 강조하고 싶었던 말은, 이와 같이 우리가 하고자 하는 AI를 활용한 모든 것에 있어 필요한 데이터는 인터넷을 통해 얻을 수 있다는 것이다. 또한, 그 빅데이터의 발전으로 인해 AI는 발전하고 있다는 것이다.
마지막으로 AI의 발전을 획기적으로 가능하게 하는 가장 강력한 무기는 바로 클라우드 플랫폼 서비스의 발전이다.
이제는 어떠한 기업도 예전처럼 자신의 회사를 위한 엄청난 크기와 비용의 컴퓨터 서버를 구입하지 않는다. 아주 특별한 경우의 것 아니라면 아마존웹서비스(AWS)나 마이크로소프트(MS) 애저, 구글 클라우드 플랫폼(GCP)이라고 불리는 아마존, 마이크로소프트, 그리고 구글 등의 회사들이 제공하는 클라우드 플랫폼 서비스를 받는다.
즉, 엄청난 크기의 컴퓨터를 빌리고 그 컴퓨터를 쓴 만큼만 돈을 내는 구조로 모든 IT 서비스의 형태가 바뀌고 있는 것이다.
이제는 AI 프로그램이나 서비스의 아이디어를 가진 스타트업 벤처라도 엔비디아나 비싼 컴퓨터 서버를 사지 않고서도 엄청난 대용량의 컴퓨팅 서비스를 받을 수 있다. 물론 비용이 적게 드는 것은 아니나, 아예 서버를 구매하거나 리스하는 것이 불가능한 상황을 쉽게 클라우드 플랫폼 서비스를 통해 해결하는 것이다.
게다가 AWS나 구글의 GCP 등에는 AI 프로그램을 개발하고 학습하고, 활용하기 위한 다양한 인프라 서비스나, 애플리케이션 단의 프로그램들이 이미 개발되어 SaaS의 형태 즉 서비스형 소프트웨어의 형태로 제공되어 그냥 쓰기만 하면 된다.
관련기사
- [기고] AI의 기본 쉽게 이해하기 2-12022.06.13
- [기고] AI 기본 이해하기2022.05.30
- [기고]AI 플레이북 어떻게 작성할까? (하)2022.05.16
- [기고] AI 플레이북, 어떻게 작성할까? (상)2022.05.02
예를 든다면 사람의 얼굴을 인식하기 위한 안면인식(Face Recognition), 음성인식을 위한 스피치인식(Speech Recognition), 텍스트 번역이나 통역을 위한 변역 프로그램, 수요예측을 위한 예측(Forecasting) 등 다양한 실제 기업이나 비즈니스에서 사용하기 위한 프로그램들이 올라가 있고, 이들을 api의 형태로 불러서 사용하기만 하면 되어있다.
AWS의 경우 이러한 전체적인 기계학습(ML)이나 딥러닝(DL)을 개발하고 운영하는 플랫폼을 세이지메이커라고 정리하고 쉽게 사용할 수 있도록 플랫폼을 만들어 놓았다. 이러한 클라우드 플랫폼 서비스 덕분에 최근의 AI는 누구나 쉽게 참여할 수 있고 대폭 발전하게 되었다.
*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.