뜨는 영화추천 앱 '왓챠'의 기술적 비밀

사용자 중심 추천 방법론 투입

일반입력 :2013/12/15 11:22    수정: 2013/12/15 11:59

페이스북이나 이메일로 회원가입을 한다. 그러고 나면 영화들이 나열되며 최소 20개의 별점을 매겨달라고 나온다. 휘휘 별점을 매기다보니 어느새 20개를 넘겼다. 첫 별점 매기기를 완료하자 추천 영화들이 주르륵 나온다. 추천된 영화들을 보자니 취향에 맞는 영화들이 많다.

무명의(?) 스타트업 프로그램스가 내놓은 영화 추천서비스 ‘왓챠(Whatcha)’가 모바일 사용자들 사이에서 입소문을 빠르게 타기 시작했다.

왓챠는 가입자가 매긴 별점, 소셜네트워크(SNS) 인맥 등을 기반 데이터로 삼아 취향을 분석, 영화를 추천해 주는데 긍정적인 반응이 많다. 무심코 깔았는데 뜨는 정보들이 마음에 든다는 것이다. 그러다보니 입소문 파워는 더욱 세졌다. 꼬리에 꼬리를 물고 사용자가 증가하는 양상이다.

왓챠 앱 다운로드수는 이미 35만건을 넘어섰고, 20개 이상의 별점을 매긴 가입자도 50만명 이상이다. 별점 건수는 네이버를 넘어선지 오래다.

사용자에게 맞춤형 정보를 제공하는 추천 서비스, 만만한거 아니다. 고난도 분석 기술이 받쳐주지 않으면 어설프고 무늬만 맞춤형에 그칠 가능성이 높다. 맞춤형 추천을 표방하고 나섰다가 제대로 맞춰주지 못해 사라진 서비스들이 수두룩하다.

그래서였다. 왓챠가 SNS를 통해 입소문을 타기 시작했을 때 기자는 창업 멤버들이 어디 출신인지나 얼마를 투자 받았는지 보다는 서비스 뒷부분이 어떻게 이뤄져 있는지가 무척이나 궁금했다. 왓챠의 인프라에 뉴스가 있어 보였다.

이런 생각으로 왓챠 추천시스템 개발을 주도한 이충재 프로그램스 R&D 팀장을 최근 만났다. 그는 지난 2년간 데이터를 실시간으로 분석해 영화를 추천하는 엔진과 알고리즘 개발을 이끌었다.

얘기를 들어보니 역시 왓챠에는 만만치 않은 공력이 투입됐다. 한두명이 뚝딱 만든 서비스가 아니라는 얘기다. 우선 추천 방법론에 관한 것이다. 이충재 팀장은 “추천을 위한 분석 방법론은 많은데, 여러 종류를 실험해서 만들어나갔다”라며 “왓챠의 예상별점은 일반적으로 사용되는 콜레보레이트 필터링이란 기술을 기본적으로 사용한다”라고 설명했다.

콜레보레이트 필터링이란 A와 B 사이의 공통점을 근거로 하는 방법이다. A란 가입자가 ‘가, 나, 다’란 영화를 재밌게 봤고, B란 가입자가 ‘가, 다, 라’란 영화를 재밌게 봤다면, ‘가’와 ‘다’는 A와 B 모두 공통으로 재밌게 본 영화고, A에겐 ‘라’를 B에겐 ‘나’를 추천할 수 있다. 공통요소를 뽑을 사용자규모가 더 커지면 그 정확도는 높아질 것이다.

영화를 추천하기 위한 데이터를 모으는 데 결정적 역할을 하는 건 가입 시 이뤄지는 20개의 별점 매기기다. 이후 가입자의 방문이 반복되고 별점 매기는 양이 증가하면서 분석 정확도가 높아지는 것이다. 왜 하필 20개였을지 궁금해진다.

이충재 팀장은 “추천을 하려면 취향을 수집해야 해서 직접 데이터를 입력해달라고 부탁한 격이다”며 “처음에 사람들이 귀찮아 하지 않을까하는 걱정이 있었는데, 의외로 사람들이 별점 매기는 행동 자체에 재미를 느껴 데이터를 기대보다 더 많이 넣어준다”고 말했다.

또 “아무 영화나 보여주면 취향 분석이 제대로 안 될 수도 있기 때문에 분석에 너무 욕심을 내서 전혀 모르는 영화만 보여주면 이탈하게 될 것이라 생각했다”라며 “그 사람이 어떤 영화에 점수를 주느냐 분석해서, 어떤 영화를 보여줘야 적은 개수로 보여줘도 취향 분석을 정확하게 할 수 있을까 고려해 노출한다”라고 덧붙였다.

20개란 최소 별점 개수는 ABC테스트를 거쳐 정해진 숫자다. 너무 적으면 취향을 분석할 충분한 데이터를 모으기 어렵고, 너무 많으면 지루해한다는 점을 감안한 것이다. 최소 별점 개수를 10개, 20개, 30개 등으로 정한 뒤 초기 추천 정확도, 재방문, 실제 이용 등의 통계분석으로 20개가 가장 적합하다는 결론을 얻었단다.왓챠에 개인별로 추천되는 영화를 보면 안배의 느낌을 받을 수 있다. 유명한 영화뿐 아니라 대중적 인지도가 낮은 영화, 취향에 배치되는 영화가 종종 노출된다.

그는 “지루하지 않게 한다고 모든 사람이 보는 영화만 늘어놓으면, 별점을 다 5점으로 줄 것이다”라며 “가입자가 싫어할 만한 것도 보여줘 보고, 다양한 시도를 하면서 최적화를 많이 했다”라고 말했다.

이 같은 별점매기기와 추천되는 영화의 정확도 높이기는 실시간으로 이뤄진다. 가입자가 별점을 매기면 관련 데이터가 추천서버에 입력되고, 연산작업을 거쳐 실시간으로 취향분석을 한 뒤 가입자에게 다시 추천영화를 노출한다. 꽤 많은 가입자 취향분석이 이뤄질 텐데 그 속도가 제법 빠르다.

그는 “실시간으로 분석이 잘 되려면 사용자가 많아져도 바로 대응할 수 있어야 한다”라며 “확장성 문제를 해결하기 위해 아마존웹서비스(AWS) 상에서 서버가 자동으로 대응할 수 있게끔 했다”라고 강조했다.

왓챠의 경우 무턱대고 당신이 좋아할 만한 영화라는 식으로 추천하지 않는다. 영화감독, 배우, 장르 등의 이유별로 추천한다. 이는 기계적인 느낌을 주지 않으려는 의도다.

그는 “추천을 할 때 사용자의 행동을 기반으로 어떤 감독을 좋아할 것이냐 등의 추천 이유들을 붙여주는데, 생전 처음보는 영화를 갑자기 추천한다면 와닿지 않을 것이기 때문”이라며 “아직 부족하긴 하지만 사용자에게 진짜 추천을 해주는 기분을 느끼게 하려고 노력한다”라고 말했다.

현재 왓챠의 추천 정확도 수준을 물었다. 서비스 웹페이지에 나오듯 넷플릭스의 추천서비스와 비교해도 부족하지 않다는 답변이 나왔다.

그는 “학계에서 가장 많이 참조하는 RMS란 수치에서 넷플릭스와 거의 비슷한 수준을 보이고 있다”라고 답했다.

왓챠의 추천이 100%라 말하긴 어렵다. 여전히 서비스의 정확도를 높이기 위한 시도는 이어지고 있다. 머신러닝, 특이취향 등에 대한 연구가 이뤄지고 있다.

그는 “머신러닝은 내부적으로 가장 많은 기술스터디를 하는 분야인데, 확장성을 확보하는게 까다롭다”라며 “작은 데이터세트를 대규모 컴퓨팅 파워로 하는 기술을 어떻게 쉽게 확장할 수 있느냐를 보면서 잘 적용하려 노력중이다”라고 말했다.

그는 이어 “취향 데이터가 쌓이다 보니 생각보다 더 다양한 것을 볼 수 있게 된다”라며 “예를 들면 그 사람이 종교적 성향이 강한지, 정치적 성향은 어떤지 같은 걸 알 수 있는데, 이렇게 알게 된 다양한 배경을 염두에 두고 추천하면 더 설득력있는 추천을 할 수 있을 거라 생각한다”라고 덧붙였다.

관련기사

프로그램스는 최근 메가인베스트먼트, 삼호그린인베스트먼트, 캡스톤파트너스 등 3개 벤처투자사(VC)로부터 25억원의 투자금을 유치했다. 작년 5월 케이큐브벤처스에서 받은 8억원 투자에 이은 두번째 투자금 유치다.

회사측은 1년만에 이뤄진 두번째 투자금 유치에 대해 그동안 쌓아온 기술력과 서비스에 VC의 평가가 좋았기 때문이라고 분석했다.