확률 싸움에 더해 상대방을 속고, 속이는 심리전이 필요한 포커게임에서 인간 대표들을 무너뜨린 인공지능(AI)은 어떤 분야에서 힘을 받을 수 있을까?
포커게임은 공개된 카드와 내가 쥐고 있는 카드를 보면서 상대방의 패를 예상하고, 때로는 안 좋은 패를 갖고 있더라도 좋은 패를 쥐고 있는 것처럼 배짱을 부려 베팅할 수 있어야 한다. 이러한 전략적인 추론능력을 갖춘 AI는 앞으로 충분한 데이터가 주어지지 않은 불확실한 상황에서 최적의 판단을 내려야하는 여러 분야에 활용될 것으로 예상된다.
최근 미국 카네기멜론대 연구팀이 개발한 인공지능(AI) 알고리즘인 '리브라투스(Libratus)'는 20일 간 프로 포커 선수들과 대결 끝에 승리하면서 불완전한 정보만을 갖고도 전략적인 추론을 통해 인간의 능력을 넘어설 수 있다는 사실을 증명했다.
■리브라투스가 쓴 3단 전략 다시보니…
바둑의 경우 한 경기에 150수 이상을 둔다고 가정하면 경기가 끝날 때까지 250의 150제곱이라는 경우의 수 중에서 이길 확률이 높은 수를 찾아간다. 리브라투스가 프로 포커 선수들이 대결을 펼친 무제한 텍사스 홀덤 포커게임은 10의 160제곱으로 바둑에 비해 고려해야하는 경우의 수는 적다. 그러나 한 가지 분명한 차이점이 있다. 상대방이 낮은 패를 갖고 배짱을 부리는지에 대해서도 판단을 내려야 하고, 반대로 배짱을 부릴 수도 있어야 한다는 점이다.
리브라투스를 만든 카네기멜론대 컴퓨터사이언스 전공 투오마스 샌드홀름 교수는 이 AI가 크게 3가지 전략을 가졌다고 설명한다. 먼저 사전에 기본적인 전략을 짜는 작업이다. 리브라투스는 수많은 가상경기를 치러 상대방에게 이기기 위한 기본 전략의 틀을 세운다.
두번째는 게임 도중에 계속해서 전략을 수정한다. 무제한 텍사스 홀덤에서 카드가 한 장씩 공개되면서 베팅이 이뤄질 때마다 이 AI는 '엔드-게임 솔빙(end-game solving)'이라는 작업을 수행한다. 이를 통해 카드가 차례로 공개될 때마다 자신이 게임에서 질 확률을 다시 계산한다.
마지막으로는 매일 경기를 치른 뒤에 마치 보안업데이트를 하는 것처럼 프로 포커 선수들이 자신을 공략했던 취약점을 분석한 뒤 이를 보완하는 전략을 짜는 작업을 수행한다. 심지어 상대방이 AI가 가진 취약점들 중 이미 알고 있는 것과 그렇지 못한 것을 구분해 우선순위를 매긴 뒤 중요한 순서대로 보완하는 작업을 거친다.
그 결과 리브라투스는 첫째주 경기에서는 베팅을 할 때 몇 가지 약점을 다른 선수들에게 노출시켰지만 이후에는 그런 약점을 최소화하면서 경기력을 높여갔다.
■사이버보안-의료 분야 활용 주목
리브라투스의 가장 큰 성과는 AI에 수많은 데이터를 쏟아부어 학습을 시키지 않고서도 상황에 따라 목표를 달성하기 위한 전략을 짜고, 실시간으로 수정하면서 정교하게 가다듬어 갈 수 있다는 사실을 증명한 것이다.
이를 두고 카네키멜론대 컴퓨터사이언스과 프랭크 페닝 학장은 "포커게임 뿐만 아니라 비즈니스협상, 군사전략, 사이버보안, 의학적 치료 등 분야에서도 이러한 AI를 활용할 수 있다"고 말했다. 완벽한 정보가 주어지지 않은 상황에서 잘못된 정보를 걸러내고 실시간으로 자신의 전략을 수정해 나가면서 가장 좋은 결과를 얻을 수 있는 방법을 찾아갈 수 있기 때문이다.
미국 과학기술전문 웹진인 IEEE스펙트럼은 포커대결에서 AI의 승리를 두고, 이러한 성과를 여러 분야에 활용할 수 있을 것이라고 강조했다. 특히 특정한 치료방법에 면역력을 가진 바이러스를 잡기 위한 치료약을 만든다거나 비즈니스 협상을 자동화하고, 사이버보안, 군사로봇시스템, 금융 등 영역에 활용할 수 있을 것으로 기대했다.
글로벌 시장조사업체 CB인사이트 선정 100대 인공지능 기업(The AI 100)에 선정된 국내 의료영상진단기업인 루닛 이정인 최고기술책임자(CTO)는 "AI의 전략적인 추론이 결국에는 앞으로 어떤 상황이 될 지 예측해서 확률이 높은 쪽으로 의사결정을 하는 것인 만큼 어떤 문제를 잘 풀기 위한 모델을 세우고 데이터가 충분하다면 여러가지 방향으로 활용될 수 있다"고 말했다. 그는 "제약회사가 임상실험 비용을 줄이기 위해 임상결과를 미리 예측해보거나 신약개발 등에서도 이미 AI를 활용하고 있다"고 설명했다.
포커게임을 이긴 AI는 충분히 많은 데이터를 확보하지 않은 상황에서도 가장 유리한 방향으로 전략적인 판단을 할 수 있다는 사실이다. 의학 뿐만 아니라 비즈니스협상, 군사전략, 사이버보안 등은 법, 세무회계 등 분야와 달리 완벽한 정보가 주어지지 않은 상황에서 의사결정을 내려야하는 만큼 포커게임에서 보여준 AI의 기술력은 이런 분야에서 힘을 받을 가능성이 커졌다.
관련기사
- 포커 정복한 AI, 어디까지 진화할까2017.02.05
- AI는 어떻게 심리싸움 '뻥카'까지 알았을까2017.02.05
- AI 녹인 챗봇, 글로벌 시장서 어떻게 쓰일까?2017.02.05
- 스탠다임, AI 기반 약물 용도변경 솔루션 공개2017.02.05
사이버보안 분야에서도 AI는 새로운 화두로 부상했다. 지난해 글로벌 해킹 컨퍼런스 데프콘24에서 미국 방위고등연구계획국(DARPA)은 '사이버그랜드챌린지(CGC)'라는 컴퓨터들 간 해킹대회를 개최했다. 이 대회는 해커들 간에 실력을 겨루는 '캡처더플래그(CTF)'라는 해킹대회 룰을 따른다. 같은 조건의 가상서버를 두고 상대방 서버에서 취약점을 발견해 공격을 수행하고, 자신은 해당 취약점에 대해 방어할 수 있도록 보안패치를 하는 식으로 공격과 수비를 오가면서 가장 많은 점수를 기록한 팀이 이기는 방식이다.
이런 대회는 궁극적으로 언제 어떤 방식으로 취약점을 공략해 뚫고 들어올지 모르는 공격자에 대응하기 위한 자동화된 사이버보안시스템을 만드는 것을 목표로 한다. 포커게임을 이긴 AI에 쓰인 전략적 추론은 악성코드를 분석하거나 소프트웨어에서 취약점을 분석해내는 등 작업을 보다 제한된 정보만으로 보다 정교하게 파악할 수 있게 도움을 줄 것으로 전망된다.