바둑 게임 AI...한국 '돌바람' vs 북한 '은별'

게임입력 :2016/03/16 11:29    수정: 2016/03/16 11:43

전 세계의 이목이 집중된 이세돌 9단과 인공지능 알파고와의 대결이 지난 15일 막을 내렸다.

이번 대국은 매우 많은 경우의 수로 인해 인공지능이 사람을 이기기 어렵다고 여겨진 바둑에서 머신러닝과 클라우드 컴퓨팅을 기반으로 한 인공지능이 얼마나 효과적으로 사용될 수 있는지 보여준 계기가 됐다.

알파고 열풍이 거세지면서 정부도 인공지능을 포함한 지능정보기술 육성 방안 마련에 서두르고 있다. 미래창조과학부는 다음 달 발표할 예정이었던 지능정보기술 육성방안 세부 계획을 이달 내 공개한다. 또한 지능정보기술연구소를 설립하고 인공지능 등 주요 연구에 300억 원의 예산을 투입하기로 했다.

한국은 이세돌 9단을 비롯해 이창호 9단, 박정환 9단, 김지석 9단 등 강자를 보유한 세계적인 바둑강국이지만 바둑 인공지능에 관한 연구는 아직 많이 이뤄지지 않고 있다. 그렇다면 일반인들이 즐기고 있는 온라인 바둑 게임에 적용된 인공지능은 무엇이 있을까?

이세돌 9단과 알파고의 대국.

■ 짧은 기간 빠르게 성장한 돌바람

국내에서는 누리그림(대표 임재범)이 지난 2012년 첫 선보인 인공지능 돌바람이 짧은 개발 기간에도 불구하고 독보적인 성과를 보이고 있다. 지난해 11월 10일부터 15일 중국에서 열린 제1회 미림합배 세계컴퓨터바둑토너먼트에서 결승에서 일본의 젠을 꺾고 우승을 거두며 세계 1위 자리에 오르기도 했다.

또한 돌바람은 지난해 4점을 깔고 조치훈 9단을 이기면서 주목을 받았으며 이번 알파고와 이세돌 9단의 대국을 실시간 중계하기도 했다. 현재 넷마블게임즈와 한국기원 등에 인공지능 기술을 활용한 자동 계가 시스템을 제공 중이다.

돌바람은 현재 아마 5단 정도로 실력을 인정 받고 있다. 추후 딥러닝 등의 기술을 도입하기 위해 검토 중인으로 알려져 알파고에 견줄만한 성과를 낼 수 있을지 관심이 높아지고 있다.

미림합배 세계컴퓨터바둑토너먼트에서 우승을 거둔 임재범 누리그림 대표(왼쪽에서 세번째).

■ 수년간 세계 대회를 제패한 북한의 은별

북한도 은별이라는 바둑 인공지능을 1997년부터 개발 중이다. 이 프로그램은 1998년 세계컴퓨터바둑대회에서 처음 우승 후 2003년부터 2006년까지 4년 연속 세계 컴퓨터 바둑 대회에서 우승을 기록하는 성과를 거뒀다.

이후 북한은 은별 2006과 은별 2010등의 업그레이드 버전을 출시해 왔다. 은별2010은 2009년 일본 세계컴퓨터바둑대회에서 전승으로 우승을 기록했다. 이 인공지능은 국내에도 PC버전과 스마트폰 앱으로 출시하고 엠게임 바둑과 타이젬의 인공지능 모드 기반으로도 쓰이고 있다.

하지만 남북관계 악화로 현재 은별2010 이후 버전은 국내에서 구할 수 없으며 일본에서는 은성위기라는 이름으로 은성위기 2015를 출시했다.

은별의 개발에 참여한 김찬우 5단은 은별 2010의 실력이 아마 3단 이상일 것으로 평가했다. 다만 이후의 버전은 국내에서 확인할 수 없어 실력을 가늠할 수 없는 상황이다.

모바일 버전으로 출시된 은별바둑.

■ 바둑 인공지능의 성격을 가르는 알고리즘

돌바람과 은별 그리고 알파고를 비교하면 세 인공지능은 모두 몬테카를로 방식의 알고리즘을 사용하고 있다.

몬테카를로 방식은 기존 모의대국의 결과를 바탕으로 최선의 수를 계산해 선택하는 방식이다. 프랑스의 레미 쿨롱 교수가 개발한 크레이지 스톤에서 가장 먼저 쓰였으며 현재 개발 중인 대부분의 바둑 인공지능에서 쓰이고 있다.

다만 몬테카를로 방식은 반복적인 모의 실험을 통해 답을 찾아내는 틀에 해당하기 때문에 이를 얼마나 바둑에 적합하게 최적화하고 효율적으로 사용하느냐에 따라 인공지능의 성능과 바둑을 두는 스타일이 달라진다.

돌바람은 동등한 PC 사양에서 겨루는 대회인 미림합배에서 우승을 거두며 우수한 수준의 바둑 알고리즘과 최적화된 몬테카를로 방식을 사용하고 있으며 중후반 끝내기에 강점이 있다는 평가를 받고 있다.

국내에 출시됐던 은별2010은 포석이 약한 편이지만 공격적이고 전투에 강하다는 평가이며 몬테카를로 방식과 고유의 알고리즘을 결합해 사용한다.

세계컴퓨터바둑대회에 참가한 돌바람.

반면 알파고는 정책망과 가치망이라는 두 개의 네트워크 프로세스를 이용한다. 정책망은 어디에서 바둑을 시작할 것인지 결정하는 것으로 딥러닝을 사용하면서 기존 바둑 인공지능에서 볼 수 없었던 형세를 파악하고 직관적인 수를 선보인다. 가치망은 싸움이 벌어지는 국면에서 이길 수 있는 확률을 계산하고 싸움에서 이기기 위한 수를 찾으며 몬테카를로 방식이 쓰인다.

■ 시간 내 최선의 수를 찾기 위한 하드웨어가 관건

바둑 인공지능은 수 많은 경우의 수 중 최선의 수를 계산하기 위해 빠른 속도의 처리장치가 필요하다. 제한 시간 내에 최선의 수를 찾지 못한다면 패배로 이어지기 때문이다.

돌바람은 24코어를 기반으로 제작하고 있으며 초당 3만 번까지 경우의 수를 계산할 수 있다. 지난해 참가해 준우승을 거둔 일본 전기통신대학 컴퓨터 바둑대회에서는 아마존의 클라우드 컴퓨팅을 활용하기도 했다.

은별은 2009년 참가한 대회에서 16개의 CPU를 활용해 최대 1천 개 이상의 CPU를 활용한 다른 인공지능과 겨뤄 전승을 거뒀다. 다만 이후에는 대회에 참가하지 않고 있어 어떤 하드웨어를 사용하는지 확인할 수 없는 상황이다.

조치훈 9단과 4점을 두고 한 대국에서 승리한 돌바람.(사진=일본기원)

알파고는 빅데이터를 활용한 연산이 필요하기 때문에 다른 바둑 인공지능보다 대규모의 하드웨어 기반이 필요하다. 이번 이세돌 9단과의 대국에서 1천920개의 CPU와 280개의 GPU를 이용한 병렬 계산을 통해 초당 10만 개의 경우의 수를 검토한 것으로 알려졌다.

그동안 바둑 인공지능은 4점 이상을 주지 않으면 실제 바둑 기사를 넘어서기 어려울 것으로 여겨졌다. 하지만 딥러닝을 사용한 알파고가 이를 극복하면서 돌바람을 개발한 누리그림도 딥러닝 등의 기술을 도입하기 위해 검토 중인으로 알려졌다.

관련기사

누리그림의 김승동 기획팀장은 “예전부터 딥러닝을 고려해 왔지만 방대한 시스템을 마련하기 위한 비용이나 규모적인 측면에서 쉽지는 않다”며 “다만 알파고를 통해 충격을 받은 만큼 검토해야 할 것 같다”고 말했다.

김 팀장은 “돌바람의 인공지능을 활용해 초보자도 쉽게 바둑을 배울 수 있는 교육 프로그램 등을 선보일 계획”이라며 “최근 기원 등이 줄면서 바둑에 관심 있는 사람이 배울 수 있는 환경이 줄어들고 있는데 교육프로그램을 활용해 바둑에 대한 저변을 넓히겠다”고 추후 계획을 밝혔다.