"알파고 만든 강화학습, 상업용AI엔 안 통한다"

이경일 솔트룩스 "적용까지 최소 10년…트랜스퍼러닝이 적합"

컴퓨팅입력 :2017/11/15 18:12    수정: 2017/11/15 18:13

알파고 덕분에 강화학습이 대중적인 용어가 됐다. 다양한 딥러닝 기술 중 가장 널리 알려지게 됐다.

당연히 강화학습에 대한 기대도 큰 편이다. "은행에서 챗봇 만들 때 강화학습 적용하면 금방 알파고처럼 똑똑한 AI 비서를 만들 수 있지 않을까?"란 기대를 갖게 된다.

과연 그럴까?

이 질문에 대해 이경일 솔트룩스 최고경영자(CEO)는 "절대 그렇지 않다"는 답을 내놨다.

이 대표는 15일 개최된 자사 컨퍼런스에서 "강화학습이 상업적인 분야에 적용되려면 적어도 10년은 걸릴 것"이라며 부정적인 견해를 내놨다. 강화학습은 지거나 혹은 이기는 게임 같은 상황에서 잘 작동하기 때문이다.

이런 전망을 내놓는 건 이 대표 혼자만은 아니다. 딥러닝 4대 천왕이라 불리는 앤드류 응도 지난해 이 분야 세계 최고 학회 중 하나인 'NIPS'에서 같은 입장을 밝혔다.

이경일 솔트룩스 대표

이 대표는 데이터가 비교적 풍부한 분야에서 먼저 학습을 하고, 학습한 지식을 데이터가 부족한 다른 분야에 재활용하는 '트랜스퍼 러닝' 방식이 더 각광받는 연구가 될 것이라고 예상했다.

강화학습을 적용한 알파고 제로는 바둑은 잘 두지만, 체스는 전혀 모른다. 체스에 대해서 배우지 않았기 때문이다. 반면 트랜스퍼 러닝은 한 전문 분야에서 배운 지식을 다른 분야에도 적용할 수 있게 해준다. 예컨대 배드민턴 잘치는 사람이 테니스도 잘 치는 격이다.

이 대표에 따르면 솔트룩스는 현재 건국대학교와 트랜스퍼 러닝을 적용한 질의응답 AI를 연구중이다. 데이터가 많은 일반 대화 문장(74만 개)을 기계에 먼저 학습시킨 후, 금융업무 관련 대화(5천 개)를 추가로 가르치는 연구다.

강화학습뿐 아니라 "딥러닝이 곧 인공지능이라는 오해"도 깨야 한다는 게 이 대표의 생각이다.

딥러닝을 포함한 머신러닝 기술은 비기호적(non-symbolic) 접근법이라, 통제가 어렵다는 문제가 있다. 알파고 제로가 스스로 두는 바둑을 인간이 이해하기 어려운 것도 마찬가지다. 어떤 논리 구조를 가지고 행동하는지 알 수가 없다. 채팅봇이 엉뚱한 대답을 내놔도 왜 저런 문장을 만들어 냈는지 알 길이 없다.

이 대표는 이런 이유로 "지식 베이스가 딥러닝 모델과 같이 어우러질 필요가 있다"고 강조했다.

관련기사

그는 "MS리서치, 스탠포드, 바이두 같이 AI연구를 선도하는 연구그룹도 지식베이스와 딥러닝을 결합시키려는 노력을 기울이고 있다"며 "지식 기반 심층인공신경망(Knowledge Grounded DNN)라는 분야다"라고 설명했다.

솔트룩스 역시 지식 기반과 딥러닝 모델을 결합해 성능을 크게 개선한 대화형 AI '에바'를 개발중이다. 대화정확도는 70% 수준까지 보장하면서, 사용자에 따라 개인화된 맞춤형 대화까지 가능해지는 게 특징이다. 이미 출시된 솔트룩스의 대화형 AI 아담은 룰 기반, 검색 기반 모델과 지식 기반 모델이 결합해, 대화 정확도는 75% 수준이지만 사용자가 달라져도 같은 대답만 할 수 있다.