“최대한 난전을 이끌어서 알파고가 미처 계산을 끝내지 못하게 해야 한다. 이것이 이세돌 9단이 이길 수 있는 유일한 가능성이다.”
인공지능 전문업체 마인즈랩 유태준 대표이사는 "이세돌 9단이 이기는 방법은 난전"이라고 설명했다. 바둑 애호가인 유 대표는 이세돌 9단의 팬이다. 유 대표는 이세돌 9단이 10일 2국에서도 패하자 인공지능 논문을 탐독하며 밤을 꼴딱 새워가며 인간이 이길 수 있는 방법을 찾으려고 노력했다.
그가 내린 결론은 “현재 이길 수 있는 방법은 전혀 없다”였다.
유 대표는 “현재와 같은 조건이라면 이길 수 있는 길이 전혀 없어 보인다”며 “다만 한번 찾아본다면 최대한 난전을 이끌어 계산을 끝내지 못하게 하는 길 뿐”이라고 설명했다.
유 대표에 따르면 알파고와 이세돌 9단의 대국에서 패 싸움이 한 번도 없었다. 이는 알파고를 움직이는 확률 계산 방법 때문이라는 것이다.
알파고는 몬테카를로 트리탐색, 딥러닝, 강화학습을 이용해 최선의 착점을 계산해낸다. 인공지능 전문가들은 판후이 2단과 알파고 대국 이후 지난 5개월 동안 여러 기법 중 강화학습을 통해 더 강해졌을 것이라고 추정한다.
강화학습은 알파고가 또 다른 알파고와 승부를 통해 착점의 가중치를 조정하며 최고의 착점을 찾을 수 있도록 하는 방법이다. 강화학습시 승리하면 1점, 패배하면 -1점을 준다.
유 대표는 “이 말은 목적함수가 승리라는 것”이라며 “집 차이에는 관심이 없다는 것을 의미한다”고 말했다.
1, 2국에서 패싸움이 한번도 없었던 것은 알파고는 이길 수 있는 확률을 최대화하는 것을 찾기 때문이다.
유 대표는 “초반 난전을 통해 시간을 뺏고 확실한 우위를 점해야 한다”며 “안정적인 집내기 바둑으로 가면 무조건 진다”고 설명했다.
그는 “인공지능은 바둑의 체스화에 성공했다”며 “현재 시점에서 인간이 컴퓨터와 체스를 두면 이길 수 없다”고 강조했다.
지난 9일 1국에서 알파고는 여러번 실수하는 듯 보였다. 특히 우하귀에서 이세돌9단이 10집 넘는 손해를 보는 실착을 한 후에 알파고도 덩달아 실수를 한 듯 했다. 그러나 이는 실수가 아니었다. 승패가 갈리지 않고 무조건 이기는 착점에 대한 계산을 끝낸 최선의 수였다.
유 대표는 “판후이와의 대국을 보고 이세돌9단이 알파고의 실력에 대해서 낮게 평가한 것도 알파고가 집 차이를 많이 내고 이기는 데에 관심이 없었기 때문”이라며 “무조건 이기는 데에만 관심이 있기 때문에 벌어진 일”이라고 말했다.
대국 시간도 이세돌 9단에게 불리한 점이다.
관련기사
- 이세돌 "알파고, 완벽했다"2016.03.11
- 알파고 승리…인공지능 어디로 튈까?2016.03.11
- 이세돌, 왜 진 줄도 모르게 또 졌다2016.03.11
- 알파고-이세돌 2국 초반…변칙과 타개의 싸움2016.03.11
알파고는 가능한 모든 착점에 대해 대국의 끝까지 수읽기를 해 가치 평가를 한다. 인간은 몇 개의 착점에 대해 30~40수 앞만 내다볼 수 있다. 기계의 수읽기 시간을 제한하던지 한도를 30~40수로 제한해야만 이길 수 있는 싸움이라는 의미다.
실제로 네이처에 실린 알파고 논문 속에는 판후이 기사와 알파고 속기에서 판후기 기사가 5국에서 2번 이겼다는 내용이 실렸다. 알파고 수읽기 시간을 제한했기 때문이다.