올해 초 원조 알파고를 격파해 세상을 놀래킨 알파고 제로가 또 한단계 진화했다. 이제 바둑뿐 아니라 체스와 일본식 장기 게임에서도 인간을 초월한 게임실력을 갖추게 됐다. 게임의 기본 규칙만 알려주면 어느 게임이든 스스로 터득하는 경지에 이르렀다.
6일(현지시간) 더버지, MIT테크놀로지리뷰 등 주요 IT 전문 외신들은 딥마인드가 논문 공개 사이트 아카이브(arXiv)에 새로운 알파고 제로에 대한 논문을 발표했다고 보도했다.
올해 초 딥마인드는 강화 학습 방식을 이용해 사람의 제공한 데이터 없이도 스스로 바둑 실력을 향상시킨 알파고 제로를 공개했다. 알파고 제로는 챔피온을 이길 전략을 개발할 때까지 셀프 게임을 계속하는 방식으로 학습했다. 이렇게 단 8시간 훈련 후 알파고 제로는 세계적인 인간 바둑기사를 모두 이긴 알파고에게서 승리를 거두며 바둑 게임을 제패했다.
이번에 딥마인드가 새롭게 발표한 논문에 따르면 알파고 제로는 바둑뿐 아니라 다른 게임도 배울 수 있게 끔 범용화됐다. 딥마인드는 알파고 제로가 체스와 일본식 장기인 쇼기도 터득했다고 논문에서 소개했다.
논문에 따르면 알파고 제로는 두 게임 모두 24시간만에 인간을 초월한 실력을 갖추게 됐고 확실하게 세계 챔피온 프로그램을 물리쳤다.
MIT테크놀로지리뷰는 이번 논문에 대해 "딥마인드가 이 AI를 일반화할 수 있는 능력을 갖췄다"는 점에 주목해야한다고 평가했다.
관련기사
- "알파고 만든 강화학습, 상업용AI엔 안 통한다"2017.12.10
- 알파고 제로, 어떤 문제까지 해결할 수 있나2017.12.10
- 혼자 바둑 정복한 알파고 제로, 왜 대단한가2017.12.10
- 독학으로 알파고 이긴 ‘알파고 제로’ 나왔다2017.12.10
보도는 "체스나 쇼기는 바둑보다 덜 복잡한 게임이기 때문에 알파고 제로가 두 게임의 '킬러 스킬'을 빠르게 학습했다는 게 그렇게 놀라울 일은 아니다"면서도 "딥마인드가 AI를 일반화할 수 있는 기술을 획득했다는 점은 AI를 적용할 수 있는 분야가 더 늘어날 수 있다는 것을 의미한다"고 말했다.
보도는 또 AI가 스타크레프트 같이 아주 복잡한 온라인 전략 게임은 아직 마스터하지 못했다고도 덧붙였다. 하지만 이미 딥마인드가 스타크레프트에서 인간을 뛰어넘기 위한 준비를 하고 있는만큼, 이런 게임에서 인간이 왕좌를 뺏길 날도 멀지 않았다고 예상했다.