머신러닝 기술이 스팸메일차단 분야에서도 맹활약하고 있다는 분석 결과가 나왔다.
구글이 머신러닝 기술 덕분에 자사 이메일 서비스인 지메일 메일함에 있는 이메일 중 스팸 메일 비중은 0.1% 미만이라고 밝혔다. 스팸메일함에 받아보기 원했던 메일이 들어 있는 비중은 0.05% 미만이라고 덧붙였다.
구글은 지난 9일 지메일 블로그를 통해 머신러닝 기술에 기반한 인공지능 신경 네트워크를 유입되는 수십억건의 이메일 중 원치 않은 메시지와 피상 공격을 걸러낸 결과치를 공개했다. 보안 업체 카스퍼스키에 따르면 2015년 1분기 걸러진 모든 이메일의 59.2%가 스팸메일이었다. 스팸 발송자들은 스팸메일 차단 기술을 우회해 광고나 악성코드를 퍼뜨리기 위해 닷워크나 닷사이언스 같은 새로 공개된 도메인을 적극 활용했다.
머신러닝은 인공 지능의 한 분야로 컴퓨터가 데이터를 통해 학습하고 사람처럼 어떤 대상 혹은 상황을 이해할 수 있게 하는 기술이다. 스스로 학습할 수 있는 컴퓨터가 사용자를 이해한다면 이전에 할 수 없었던 방식의 서비스가 가능해진다는게 업계 설명이다. 머신러닝은 컴퓨터가 데이터를 분석할 수 있게 하는 알고리즘을 짜는 것이 핵심이다. 데이터를 활용하는 알고리즘을 정교하게 만들면 컴퓨터가 스스로 학습해가며 사용자들에게 의미있는 결과물을 제공할 수 있다는 것이다.
구글은 지메일을 공개 초기부터 스팸 차단 기술을 향항시키기 위해 머신러닝 기술을 사용해왔다. 스팸 보고 하기(report spam), 스팸 해제하기(not spam) 등의 버튼을 제공했다. 그러나 사용자들은 여전히 가끔씩만 스팸해제하기 버튼을 누른다는 것이 구글 설명. 스팸해제하기 버튼은 필요한 이이메일을 찾기 우해 스팸 폴더를 뒤져야 한다는 것을 의미한다.
관련기사
- 스플렁크, 머신러닝 기반 보안 스타트업 인수2015.07.13
- IBM, '아파치 스파크' 생태계에 통큰 투자2015.07.13
- IBM, 왓슨 한국 사업 속도 낸다2015.07.13
- 페북 인공지능, 사진 흐릿해도 사람 얼굴 인식2015.07.13
이같은 문제를 해결하기 위해 구글은 '지메일 포스트마스터 툴'이라는 시스템를 선보인다. '지메일 포스트마스터 툴'은 대량으로 이메일을 발송하는 기업들이, 전송 에러, 스팸 리포트, 평판 등에 대한 데이터를 분석할 수 있게 해주는 솔루션이다. '지메일 포스트마스터 툴'에 대해 구글은 기업들을 위한 시스템이지만 스팸함을 뒤질 필요가 없다는 점에서 개인 사용자들에게도 도움이 될 수 있다고 설명했다.
구글은 머신러닝이 스팸차단의 핵심 기술로 부상했다고 강조했지만 구체적인 통계치는 공개하지 않았다. 그러나 머신러닝 기술 덕분에 지메일은 해당 메일이 진짜로 보낸 사람으로부터 온 것인지 이해하고, 가짜 메일은 격리시키고 있다고 강조했다.