스타크래프트 AI…"손 빨랐지만, 상황 판단 느렸다"

프로선수 넘기엔 역부족…돌발상황 대처 한계

컴퓨팅입력 :2017/10/31 19:50

손경호 기자

"손은 빠르지만 상황 판단력은 부족했다."

인공지능(AI)에게 스타크래프트의 벽은 높았다. 일반인을 상대로 높은 실력을 보여줬던 AI는 프로 선수에게는 맥없이 무너졌다.

31일 세종대학교 대강당에선 흥미로운 대결이 펼쳐졌다. 인간과 AI의 스타크래프트 대결. 바둑에 이어 스타크래프트에서도 AI 파워를 보여줄 수 있을 지에 관심이 쏠렸다.

이달 대회는 세종대학교와 세종사이버대가 주최하고 삼성SDS가 후원했다. AI 쪽 대표 선수인 호주 ZZZBOT, 노르웨이 TSCMOO, 세종대 김경중 교수 연구팀이 개발한 MJ봇, 페이스북 체리파이 등은 인간과 대결에서 강점과 한계를 동시에 드러냈다.

이들은 AI 간 스타크래프트 대결에서는 내로라 하는 실력을 자랑했지만 인간과 대결에서는 초반 경기 운영이나 중반까지 상황에서 상황판단 능력이 부족한 점들이 눈에 띄었다.

이승현씨와 1경기에서 MJ봇은 초중반 승기를 잡고도 우왕좌왕하는 모습을 보였다.

■ "일반인 이기는 수준 1차 목표로 했다"

경기를 모두 마친 뒤 MJ봇 연구팀을 이끌고 있는 세종대 컴퓨터공학과 김경중 교수는 "지난 6월부터 개발 작업에 들어갔으며 레더점수로 1천500점 수준의 일반인을 이기는 것을 1차 목표로 삼았었다"며 "아직은 프로게이머를 이길 수 있는 단계는 아니다"고 설명했다.

스타크래프트에서 레더점수 1천500점은 일반인의 평균적인 게임실력을 나타낸다.

김 교수에 따르면 현재 스타크래프트에 활용되고 있는 AI는 대부분 해당 게임에 필요한 여러가지 모듈 아키텍처를 조합한 형태로 만들어진다. 일반인들 간 스타크래프트 경기에 대한 리플레이, 각종 경기를 통해 수집한 데이터 등을 바탕으로 A라는 상황에 대해 B로 대처하라고 프로그래밍을 하는 방식을 썼다.

그러다 보니 수시로 바뀌는 여러 돌발상황에 대한 대처능력이 부족한 점이 눈에 띄었다.

김 교수는 "스타크래프트는 정찰, 전투, 확장, 채취, 각종 상황에 대한 의사결정이 이뤄져야하는데 여기서 어떤 타이밍에 어떤 행동을 취하라고 프로그램이 짜여져 있기는 하나 어떤 것을 버리고 취해야할지에 대한 판단을 하기에는 부족하다"고 평가했다.

TSCMOO는 뮤탈리스크를 산개하며 커세어를 공격하는 모습을 보여줬다.

일반적으로 AI는 여러 개 데이터를 입력하면 스스로 반응해서 이후 새로운 데이터가 입력됐을 때도 비슷한 반응을 내놓을 수 있도록 알고리즘을 찾아내는 작업이 필요하다.

그러나 스타크래프트 AI의 경우 이 같은 방법이 쓰이지는 않았다.

딥마인드가 개발한 알파고에 적용된 강화학습이나 인공신경망을 활용하는 딥러닝이 활용된 것도 아니다.

이와 관련 김 교수는 "스타크래프트2에 대해서는 게임 개발사인 블리자드가 공식적으로 API를 지원하고 있지만 전체적으로 스타크래프트 AI에 대한 연구는 초기 단계이고, 알파고라고 하더라도 자원을 채취하거나 공격을 시키는 등 일부 행동에 대해서만 AI를 지원할 뿐 전체 게임을 할 수 있는 수준은 아니다"라고 설명했다.

실제로 프로토스 종족을 선택한 일반인 플레이어 이승현씨와 첫 대결을 펼친 MJ봇은 초중반에 12시에 위치한 프로토스 본진을 초토화 시킨 상황에서 이승현씨가 다른 곳에 지은 건물을 찾지 못하고 우왕좌왕하다가 결국 역전패 당했다.

■ AI식 컨트롤에 청중들 탄성

그럼에도 불구하고 인간과 대결을 펼친 스타크래프트 AI들은 경기 도중 몇몇 장면에서 청중들의 감탄사를 자아내기도 했다.

앞서 첫 대결에서 MJ봇의 테란은 시즈탱크를 운영하면서 상대편에 반응해 빠르게 시즈모드를 하는 모습을 볼 수 있었다.

이승현씨와 세번째 경기를 펼친 TSCMOO의 플레이도 신선했다. 이 AI는 저그 종족을 선택해 초반 운영을 안정적으로 가져갔다. 그 뒤 이승현씨가 공중유닛 중 하나인 커세어를 뽑아 공격을 시도하자 이에 맞서 공중유닛인 뮤탈리스크를 여러 대 뽑아 커세어 1기에 대해 피해를 최소화하도록 흩어지면서 일사불란하게 치고 빠지는 식의 공격을 선보였다.

김 교수는 "MJ봇의 경우 APM이 최대 7만까지 올릴 수 있다"며 "경기에서는 최대 2만까지 APM이 올라가기도 했다"고 설명했다. 다만 그는 "APM이 높은 게 이득이 되려면 경기를 후반까지 끌어가야하는데 AI가 초반에 너무 극단적인 전략을 취하는 경우가 많았다"고 말했다.

APM는 스타크래프트 상에서 유닛을 컨트롤 하는 속도를 말한다. 앞서 AI가 보여준 시즈탱크나 뮤탈리스크 컨트롤은 모두 APM 면에서는 프로게이머를 뛰어 넘는 수준이다.

송병구 선수와 대결에서 MJ봇은 입구를 틀어막는 등 인간 플레이어와 상당히 비슷한 게임 운영 능력을 보여주기도 했으나 교전에서는 프로 선수의 컨트롤을 당해내지 못했다.

관련기사

결론적으로 대결에 참가한 AI들은 모두 유닛 자체를 컨트롤하는 능력은 뛰어나지만 전략 상 어떻게 플레이하는게 최선일지에 대한 상황 판단 능력은 떨어지는 경우가 많았다. 의사결정 모델을 제대로 갖추기가 쉽지 않다는 것이 스타크래프트 AI가 공통적으로 해결해야할 과제라고 김 교수는 설명했다.

스타크래프트처럼 실시간으로 상황 판단이 필요하면서도 최소 10분에서 1시간 이상 대결을 펼치는 전략시뮬레이션 게임에서 일반인을 대상으로 좋은 승률을 거뒀다는 점에서 앞으로 발전 가능성에 주목된다.