스타2 AI '알파스타' 프로게이머에게 10대1 압승

인상적인 생산력과 컨트롤...전술은 단순

디지털경제입력 :2019/01/25 09:55    수정: 2019/01/25 09:56

구글 딥마인드가 개발 중인 스타크래프트2 AI '알파스타'의 실력은 기대 이상이었다.

구글 딥마인드는 25일 오전 3시(한국 시간) 스타크래프트 트위치 채널과 딥마인드 유튜브 채널을 통해 스타크래프트2 AI '알파스타'와 프로게이머의 대결을 공개했다.

북미 프로게임단 팀리퀴드의 프로게이머 다리오 뷘시와 그레고리 코민츠를 상대로 각각 총 11번의 대결을 펼친 '알파스타'는 이들을 상대로 단 한 경기만 내주고 승리를 거뒀다.

경기에 앞서 규칙을 설명하는 구글 딥마인드 관계자

AI가 프로토스 동족전 밖에 치를 수 없기 때문에 모든 대결은 이에 맞춰 진행됐다. 저그를 주종족으로 하는 다리오 뷘시와 경기에서 알파스타는 5:0 승리를 거뒀다. 하지만 다리오 뷘시가 저그를 주종족으로 하는 선수이기에 '알파스타'의 승리는 온전한 실력에 기반한 것이 아니라 프로선수에게 주어진 일종의 핸디캡 때문에 거둘 수 있던 것으로 여겨지기도 했다.

하지만 프로토스를 주종족으로 하는 그레고리 코민츠와의 대결에서도 완승을 거두자 분위기가 달라졌다. 인터넷 스트리밍을 통해 경기를 관람하던 이들 사이에서 '알파스타'의 실력에 감탄하는 이의 비중이 부쩍 높아진 것이다.

경기 내내 '알파스타'는 프로게이머를 상대로 항상 생산력 우위를 점했다. 초반 정찰로 상대의 위치를 빠르게 파악하는 기민함도 보였다.

그레고리 코민츠와 알파스타의 대결 결과

기지 확장을 시도하지 않고, 생성한 병력을 나누지 않고 항상 모든 병력을 한번에 이동하는 등 효율성이 떨어지는 모습을 보이기도 했다. 하지만 압도적인 생산량과 세밀한 조작은 이런 단점을 상쇄하고도 남는 수준이었다. 특히 십수 개의 유닛을 한몸처럼 움직이며 상대를 공격하는 모습은 일반적인 프로게이머들의 대결에서도 볼 수 없는 수준이었다.

'알파스타'가 게임을 이해하고 진행하는 방식 역시 인상적이었다. '알파스타'는 실시간으로 정찰을 통해 시야를 확보하고, 이를 통해 어디로 이동해야 할지, 자신이 만들고 생산해야 할 건물과 유닛이 무엇인지를 찾아냈다. 그리고 각 순간마다 자신이 승리를 거둘 확률을 예상하며 최적의 결과를 내기 위한 행동을 택하는 것을 확인할 수 있었다.

알파스타의 알고리즘 설명 이미지

하지만 전술보다는 유닛 조작에 의존하는 운영만을 택했다는 점은 아쉬움을 남겼다. 실제로 '알파스타'는 모든 경기에서 '추적자'를 빠르게 생산하고 이를 한몸처럼 움직이며 상대를 압박했다. 교전 시 유닛을 움직이며 생산까지 동시에 하는 바람에 순간적으로 분당 행동수(APM)가 1천 5백까지 치솟을 정도였다.

일반적으로 프로게이머들이 기록하는 APM이 보통 3백~4백 수준임을 감안하면 '알파스타'의 APM은 비현실적인 수준이다. 즉, 전술보다는 조작 위주로 대결을 진행한 셈이다.

이러한 ‘알파스타’의 특성 때문에 APM 최대치를 제한하고 진행한 그레고리 코민츠와의 마지막 11번째 경기에서는 다른 결과가 나왔다. 생산량은 여전히 높았지만 그렇게 생산한 유닛을 적재적소에 활용하지 못하는 모습을 보이며 그레고리 코민츠에게 휘둘리는 모습을 보였다. 교전에서도 유닛 상성을 활용한 전술을 펼친 그레고리 코민츠의 공세를 막아내지 못했다.

알파스타와 프로게이머의 APM 비교

이번 대결은 지난해 11월 진행된 블리즈컨 2018에서 스타크래프트2 AI의 학습 현황이 처음 공개된 이후 약 2개월 만에 진행됐다. 당시 '알파스타'는 기본적인 전술을 겨우 수행하는 수준에 그쳤으나, 단 2개월 사이에 프로게이머를 압도하는 수준까지 실력을 끌어올렸다.

관련기사

구글 딥마인드는 이번 대결을 위해 '알파스타'가 1주일의 준비 기간을 거쳤다고 설명했다. 여러 개의 에이전트를 하나의 리그에 넣고, 각 에이전트가 대결을 펼치면서 스스로 성장하는 방식을 택했으며, 이 과정을 거쳐 상위에 오른 5개의 에이전트를 하나로 융합해 '알파스타'를 선보이게 됐다는 이야기도 이어졌다.

알파스타 준비 과정에서 벌어진 에이전트들의 대결

또한 이를 통해 1주일의 시간 동안 사람으로 따지면 200년간 스타크래프트2를 연습한 결과를 얻을 수 있었다고 구글 딥마인드 관계자는 이야기했다.