지능화되는 결제 사기, 기계학습으로 잡는다

"온라인 결제 사기는 끊임없이 변하고 발전하고 있다. 이를 룰 베이스 기반으로 막는 것은 한계가 있다고 판단해 딥러닝과 기계학습(ML)을 도입했고, 예상보다 높은 성과를 거두고 있다.”

스마일게이트 스토브 공통플랫폼개발팀 전성현 리드는 위와 같이 말하며 딥러닝 기반 결제 사기 탐지 서비스 구축사례를 소개했다.

코로나19 이후 비대면 환경의 지속으로 사이버 공격이 급증하고 있다. 게임업계의 경우 개인정보를 탈취해 게임계정을 만든 후 유료아이템을 구입해 다른 사용자에게 판매하는 식으로 현금화하는 결제사기가 증가하는 중이다. 이 밖에도 탈취한 계정에 자동사냥 매크로를 적용해 아이템을 수집해 판매하는 등 악용 범위가 넓어지고 있다.

이런 악성행위는 피해자와 기업에 금전적인 피해를 발생시킨다. 뿐만 아니라 주변 이용자에게도 불편을 끼쳐 이탈을 발생시키기 때문에 빠른 조치가 필요하다.

전성현 리드는 이를 해결하기 위해 아마존웹서비스(AWS)의 아마존 프라우드 디텍터와 세이지메이커를 도입했으며, 65%이상의 사기결제 차단 효과를 달성했다고 밝혔다. 스마일게이트 스토브의 결제 사기 탐지 서비스 구축 사례는 10일 개최한 AWS 서밋 코리아에서 확인할 수 있다.

■ 코로나19 이후 급증한 결제 사기, ML로 차단

스마일게이트 스토브는 2020년 하반기부터 급격하게 증가했다. 코로나19로 인한 비대면 사회지속과 글로벌 론칭하는 게임 증가로 사용자 수가 대폭 늘어났기 때문이다.

사이버공격을 하는 해커들의 공격 방식도 기업의 방어를 뚫기 위해 더욱 다양해지고, 치명적인 방법을 고안하기 시작했다.

전성현 리드는 “시간이 지날수록 해커들이 더욱 공격적이고, 사용자의 피해가 커지는 방법을 사용하기 시작했다”며 “예를 들어 기존에는 온라인상에 공개된 이메일 등을 수집해 사용했다면 이제는 직접 스미싱해 개인정보를 탈취하는 등 적극적으로 행동에 나서고 있다”고 설명했다.

이어서 “점차 공격방식이 다양해지고, 방어를 우회하기 위한 수단을 도입하기 시작하면서 기존 룰 기반 보호체계로는 대응이 어렵다고 판단해 딥러닝 기반 결제사기 시스템을 구축하기로 판단했다”고 설명했다.

스마일게이트 스토브는 먼저 아마존 프라우드 디텍터를 먼저 도입했다. 프라우드 디텍터는 온라인 결제사기, 가짜 계정 생성 등 사기성 온라인 활동을 식별하고 제한하는 ML 서비스다.

AWS에서 사전 학습시킨 ML 모델을 이용하는 만큼 사기탐지 서비스를 생성, 배포, 관리하는 과정에서 상대적으로 복잡한 설정이나 AI에 대한 학습 없이 사용할 수 있다.

전성현 리드는 “ML을 도입하고 싶었지만 레퍼런스가 없어 고민하던 중 AWS에서 먼저 제안을 줘서 도입하게 됐다”며 “성능도 만족스럽게 나오면서 더 나은 결과를 얻기 위해 세이지메이커를 도입하게 된 결과가 되기도 했다”고 밝혔다.

사기방지 시스템 적용 후 줄어드는 결제사기(이미지=스마일게이트)

세이지메이커는 클라우드 환경에서 ML 모델을 생성하고 학습시켜 배포할 수 있게 해주는 서비스다. 프라우드 디텍터와 달리 직접 알고리즘을 학습시켜 최적의 인공지능(AI)을 개발할 수 있다. 다만 이를 위해선 AI와 데이터를 다룰 수 있는 전문적인 데이터과학자와 개발자팀이 필요하다.

전성현 리드는 “기존부터 딥러닝을 연구해온 데이터과학자들이 있어서 도입을 크게 망설이지 않았다”며 “특히 세이지메이커는 반복작업이 많았던 기계학습 워크플로를 자동화해 보다 쉽고 빠르게 업무를 진행할 수 있다는 점도 긍정적이었다”고 설명했다.

스마일게이트 스토브는 딥러닝 기반 결제 사기 탐지 서비스 도입 약 1년 만에 사기결제 검출율을 65% 이상을 달성했다.

전성현 리드는 “기존 룰 기반으로는 20% 이상을 넘기 어려웠던 것과 비교하면 상당한 수준이라고 할 수 있다”며 “앞으로 알고리즘을 고도화하고 AI로 잡지 못한 부분은 블랙리스트나 화이트리스트 등을 연계해 최대한 제재하려 한다”고 설명했다.

■ 딥러닝 핵심은 데이터 분석

전성현 리드는 ML을 도입하는 과정에서 가장 중요한 요소로 데이터를 꼽았다. 어떤 데이터를 어떻게 학습하느냐에 따라 AI의 정확도에 큰 영향을 미치기 때문이다.

스마일게이트의 경우 데이터 분석을 위해 사용자 프로필, 결제내역, 게임데이터 등 결제와 관련된 60종의 데이터를 선정했다. 이후 이중 실제 사기결제와 연관된 데이터는 무엇인지 절반으로 추리고, 다시 선별 후 추리는 작업 등을 반복하며 가장 적합한 데이터를 검출하는 데 집중했다.

또한 일 이용자 수는 1천만 명에 결제 건은 1억 건이 넘지만 사기결제는 수백 건에 그쳐 학습을 위한 데이터가 상대적으로 부족했다. 이를 극복하기 위해 비지도 학습과 적대적 생성 네트워크(GAN) 등을 활용해 직접 데이터를 생성하며 학습에 활용하기도 한다.

전성현 리드는 “결제 사기 탐지 서비스를 도입하는 과정에서 60% 이상을 데이터 분석이 차지했다”며 “ML은 수많은 반복작업이 요구되는 만큼 가설을 먼저 세우고 이에 필요한 데이터를 발굴하고 추가되는 피쳐를 반복적으로 테스트하는 것이 효율적”이라고 조언했다.

이어서 그는 “ML을 사용하려면 통계, 확률 등 많은 수학적 지식과 데이터가 필요한 만큼, 무조건적인 도입보다 해결하려는 문제점이 AI외에 다른 해결 방안이 없는지 한번 고려해볼 필요가 있다”며 “우리도 초기에는 룰 기반 제재로 시작해 프라우드 디텍터를 사용하고 세이지메이커를 도입하는 과정을 거쳤다”고 설명했다.

■ 딥러닝과 ML로 사용자 맞춤 지원서비스도 고려

스마일게이트 스토브는 스마일게이트의 글로벌 소셜 게임 플랫폼이다. 로스트아크, 테일즈런너, 소울워커 등 PC 게임을 비롯해 모바일게임을 제공하고 있다.

국내 플랫폼 중에는 드물게 개방형 플랫폼을 지향하며 인디게임도 지원하는 등 국내 게임시장 확대를 위한 시도도 적극적이다. 더불어 가상현실(VR), 동영상 커뮤니케이션 서비스 등 자체 개발 소셜 서비스에 다양한 도전을 시도하며 지속적인 서비스 확장을 준비하고 있다.