AI산업계에 종사하는 사람들의 궁극적 목적은 일반인공지능(AGI)을 구현하는 거다. AGI는 지능을 가진 사람처럼 행동하는 AI로, 이론적으로는 사람이 하는 걸 모든 걸 할 수 있는 AI다. 일부 기능은 이미 사람을 앞서고 있다. 약 70년의 역사를 가진 AI기술이 AGI로 발전할 지는 세계 학자들 사이에 여전히 논란중이다.
13일(미국시각) 테크크런치는 알파고를 개발한 딥마인드(DeepMind)가 604개 업무를 수행할 수 있는 새로운 AI 시스템 '가토(Gato)'를 선보였다고 보도했다. 딥마인드는 '가토'에 대해 "일반인공지능(AGI)을 향한 큰 진전"이라고 주장했고, 일부 AI연구자들도 동의했다. '가토'가 수행한 업무는 아타리 2600 비디오 게임, 채팅, 사진 설명 달기, 작곡, 로봇팔 제어 등이다. 딥마인드 공동 창업자 데미스 하사비스(Demis Hassabis)는 가토에 대해 환호하며 "우리가 개발한 최고의 일반 에이전트, 우리 팀이 환상적인 일을 해냈다"는 트윗을 올리기도 했다.
알렌연구소의 AI연구원 잭 헤셀(Jack Hessel)은 "하나의 AI시스템이 여러 업무를 해결하거나 푸는 건 새로운 일이 아니다. 구글은 텍스트, 이미지, 비디오를 다 다룰 수 있는 'MUM(멀티 유니파이드 모델)'을 최근 구글 서치에 사용하기 시작했다"면서 "하지만 가토는 업무의 다양성에서 다른 AI와 차이가 난다"고 설명했다. 알버타 대학의 컴퓨터사이언스 부교수 매튜 구즈다이얼(Mattew Guzdial)도 "만일 일반인공지능을 염두에 두고 있다면, 이는 큰 진전(big deal)"이라고 평가했다. 딥 마인드는 가토가 604개 업무중 450개에서 전문가보다 더 훌륭히 업무를 수행했고, 시간도 절반밖에 걸리지 않았다고 덧붙였다.
하지만 '가토'는 업무 수행 성적만 보면 썩 인상적이지 않았다는 평가다. 이에 미국 지디넷은 '가토는 평범하다. 그런데 딥마인드는 왜 가토를 만들었을까?'를 제목으로 기사를 내보내기도 했다. 실제, 언어 수준의 경우 현재 미국 대통령을 물으면 틀린 답을 할 수 있다고 외신은 전했다.
'가토'는 하나의 신경망 모델을 이용해 텍스트, 이미지, 영상 등 다양한 양식의 데이터를 처리해 다양한 업무를 수행한 범용 에이전트다. 다중 작업(multi-task) 기반 신경망 모델로 텍스트, 이미지, 영상 같은 다양한 입력을 사전 훈련해 문맥 기반의 텍스트, 사진설명, 게임 플레이, 채팅, 로봇 동작 등을 구현했다.
'가토'는 아키텍처면에서 보면 다른 AI 시스템과 크게 다르지 않다. 구글이 만든 AI모델인 '트랜스포머'를 벗어나지 않았다는 점에서 'GPT3'와 유사하다. 하지만 AI 성능과 연관이 있는 패러미터(매개변수)는 12억개로, 1750억개의 GPT3와 비교하면 100분의 1이 안됐다.