"머신러닝 기반 뉴스 서비스도 해볼만한 승부"

카카오 박승택 박사 "다양한 콘텐츠에도 확대 적용"

인터넷입력 :2016/04/07 15:29

황치규 기자

카카오는 지난해 6월 포털 다음의 뉴스 서비스 편집을 머신러닝 기반 자동화 방식으로 전면 개편했다. 전문 에디터들이 주요 뉴스를 선별해 보여주는 게 아니라 소프트웨어 알고리즘이 사용자 성향과 행동을 분석해 맞춤형 뉴스를 자동으로 편집해주는 방식이었다.

현재 포털 다음과 카카오톡에서 보여지는 뉴스는 사용자마다 제각각이다. 나한테 보여지는 뉴스가 다른 사람에게는 안보일 수 있고, 거꾸로 다른 사람은 보이는데, 나에겐 안보일 수도 있다. 사용자가 한번 봤던 뉴스도 다시 뜨지 않는다.

사용자 맞춤형 뉴스는 나름 그럴듯해 보이나 실전에서 확실히 통한다고 보기 어려운 측면도 있다. 뉴스가 갖는 속성 탓이다. 넷플릭스처럼 관심사에만 초점을 맞춘 뉴스 서비스는 다양성이 사라져 반쪽짜리가 될 수도 있다. 관심밖 이라도 사용자에게 의미있고 사용자가 알아야할 뉴스들이 있게 마련이다. 개인 맞춤형 뉴스를 표방한 이런저런 서비스들이 나왔지만, 대중화되지 못한 것도 이와 무관치 않다.

그럼에도 카카오는 추천 기반으로 뉴스 서비스를 개편한 이후 가시적인 성과를 거두고 있다고 나름 자평하고 있어 눈길을 끈다. 뉴스가 갖는 속성을 루빅스에 충분히 반영시킨 것이 먹혀들었다는게 회사측 입장이다.

루빅스에선 개인적 관심사 외에 트렌드, 비슷한 사용자들의 선호도 데이터가 골고루 고려된다. 이를 기반으로 다양성을 해치지 않고도 개인화 환경을 구현했다는게 회사 측 설명이다. 카카오에서 루빅스 시스템 개발을 주도한 데이터사이언티스트인 박승택 박사는"넷플릭스 같은 서비스는 취향 분석만으로 가능하지만 뉴스는 관심사가 아니더라도 알아야할 것들이 많다"면서 "건강 등 생활 뉴스는 맞춤형이 의미가 있지만 시사의 경우 취향보다는 알아야할 트렌드를 보여주는 것도 매우 중요하다"고 말했다.

카카오 박승택 박사

개인화와 다양성의 조화가 주효했다는 건 숫자로도 확인할 수 있다. 박승택 박사에 따르면 루빅스 적용 이후 다음 뉴스 첫 화면에 노출되는 뉴스 콘텐츠 양이 이전보다 3.5배 증가했다. 루빅스 적용 전에 비해 IT 과학 뉴스는 3.3배, 국제 뉴스는 5.1배, 문화생활 뉴스는 5.5배 이상 노출량이 늘었단다.

전체 이용자에 비해 특정 성, 연령대 그룹에서 2배 이상 관심을 보인 기사수도 루빅스 도입 이전에 비해 3배 이상이었다.

박승택 박사는 "그전에는 다음 뉴스에서 에디터가 편집해서 보여주는 기사가 하루 200개 정도 밖에 없었는데, 이제 1천개 이상의 다양한 기사들이 노출되고 있다"고 전했다.

클릭수도 늘었다. 현재 다음앱 및 다음 모바일 첫 화면에서 뉴스클릭이 루닉스 적용 전보다 109% 증가했다.

카카오톡도 마찬가지다. 카카오톡 채널의 경우 루빅스 도입전 대비 클릭이 330% 가까이 증가했다. 박승택 박사는 "클릭하는 사용자수 자체도 40% 증가했다"고 강조했다.

카카오가 루빅스를 도입한 명분은 좋은 콘텐츠를 보다 많은 독자들에게 제대로 전달하는 것이었다. 사용자들이 화면이 작은 모바일 기기로 뉴스를 보는 비중이 커지면서, 필요한 뉴스를 제때 보여주는 것이 점점 중요해질 것이란게 회사측 입장이다.

현재 루빅스는 다음이 제공하는 서비스 60%, 카카오는 절반 정도의 서비스에 적용돼 있다. 뉴스 외에 콘텐츠 영역에도 폭넓게 쓰인다. 사용 범위는 계속 확대될 예정이다. 카카오톡과 다음앱에서 머신러닝 기반 콘텐츠 서비스가 확산될 것임을 예고하는 대목이다.

머신러닝은 구글 알파고와 이세돌 9단의 대국 이후 국민적인 관심사가 된 인공지능(AI) 분야 혁신을 주도하는 기술이다. 머신러닝은 디지털 서비스 패러다임에 근본적인 변화를 몰고올 대형 변수로 꼽힌다. 뉴스 역시 마찬가지다. 시간이 갈수록 좀더 세분화된 맞춤형 뉴스 서비스가 가능할 것으로 보인다.

관련기사

루빅스에서 머신러닝은 기사들이 실시간으로 계속 들어오는데, 이중 어떤걸 먼저 보여주는게 클릭을 유도할지 확률로 판단하는 역할을 한다.

박승택 박사는 "처음에는 데이터가 많지 않았는데, 지금은 데이터가 많이 쌓였다"면서 "데이터가 축적될 수록 개인화 수준도 점점 진화할 것이다"고 말했다. 또 "예전에 사람이 편집했다면 대중성이 약해 묻혔을 가능성이 큰 뉴스도 적합한 독자에게 제때 전달할 수 있는 환경도 머신러닝을 기반으로 제공해 나가겠다"고 덧붙였다.