네이버, ‘모바일 검색’ 이렇게 진화한다

지역·리얼타임·멀티미디어 검색 프로젝트 공개

일반입력 :2015/04/29 23:05    수정: 2015/04/30 09:28

네이버 모바일 검색이 차별화된 검색 기술로 더 친절하고 스마트하게 진화한다.

네이버는 29일 이용자들의 모바일 사용성에 맞춘 검색 결과를 제공하고자 내부적으로 추진 중인 연구 과제 가운데 일부 근 시일 내에 적용될 가능성이 높은 프로젝트 일부를 공개했다. 이 중에는 지역·실시간·멀티미디어 등 검색 프로젝트 등이 포함됐다.

이번에 공개된 프로젝트들은 현재 내부에서 테스트를 거치고 있다. 테스트 결과에 따라 실제 서비스에 적용이 가능하다고 판단될 경우, 이르면 상반기 중 실제 서비스로 구현될 예정이다.

네이버는 모바일 환경에서의 이용자들의 정보 탐색 및 콘텐츠 소비 패턴을 면밀히 분석해오고 있다. 네이버의 분석 결과에 따르면 이용자들은 모바일에서 쇼핑 검색 이외에도 ▲실시간성과 지역 검색 니즈가 크고 ▲정답형 또는 추천 정보에 대한 수요가 많으며 ▲긴 텍스트 대신 이미지 등의 콘텐츠만으로 의미를 함축적으로 전달하는 등의 PC와 다른 경향들을 보인다.

이에 네이버 검색연구센터는 이용자들의 정보 탐색 만족도를 높이기 위해 검색에 시간과 공간의 개념을 더욱 확장해 적용할 예정이다. 모바일에서의 문서수집, 자연어처리, 스팸 및 어뷰저 필터, 검색 모델링 등 다양한 검색 연구 과제 및 내부 테스트를 진행하고 있다.

네이버는 대규모 데이터 분석을 통해 선보여온 ▲두 클릭 뒤의 검색 행위까지 미리 예측할 수 있는 'NCKP'(Naver Contextual Knowledge Plus) ▲독립적으로 구축된DB를 매시업시켜 새로운 관계형 DB를 추론해내는 'NCR'(Naver Contents Repository)-Mash up ▲독보적인 수준의 '자연어 이해'(Natural Language Understanding) 처리 능력 등 차별화된 검색 기술력을 확보해왔다.

김광현 검색연구센터장은 “이용자들의 모바일 검색 이용 패턴 분석과 다양한 프로젝트들의 성과에 따라 기존의 검색결과 노출 방식의 개선도 고려하고 있다”며 “이용자 검색 의도에 맞는 정답 및 추천 중심의 정보를 자동으로 노출하는 검색 알고리듬 도입도 검토 중”이라고 말했다.

■사용자 관심사 분석 통한 지역 검색 알고리듬 변화

이용자들이 모바일 환경에서 네이버를 통해 검색하는 키워드 중 지역 정보와 관련된 키워드가 절반가량에 달할 정도로, 지역 정보에 대한 검색이 활발하게 이뤄지고 있다.

네이버에 따르면 지역 검색은 이용자의 위치·시간·날씨 등에 따른 검색 의도가 명확하게 달라지는 특성을 보인다. '여의도 한강공원'·'전주한옥마을' 등과 같이 명소를 중심으로 시간·공간 등에 따른 검색어의 입력 패턴이 명확해지고 있다.

예를 들어 '해운대'라는 키워드는 해운대 이외 지역에서는 '맛집'·'가볼만한 곳'·날씨' 등의 키워드가 주로 입력된다. 그러나 해운대 내에서는 '근처정보'나 '센텀시티' 등과 같은 특정 장소에 대한 검색어 입력빈도가 높으며, 또한 시간대별로 선호하는 업종이 달라진다.

결국 이용자들은 지역성 질의어를 통해, 시간대별로 무엇을 먹고, 해야 하고, 어떻게 가야 하는지 등 '가이드 북'과 같은 형태로 검색을 이용하고 있다는 뜻으로 풀이된다.

이에 네이버는 ▲각종 문서에서 위치·시간·날씨 및 질의어 등의 변수에 기반해 지역 관련 관심사를 알고리듬으로 추출해내는 '사용자 관심사 분석 모델' 기술 ▲장소별로 마이크로 리뷰를 추출해 낼 수 있는 '그래프 기반 마이크로 리뷰 추출' 기술, '실시간 트렌드 업체 추출' 기술 등 다양한 분석 기술을 개발하고, 활용하는 다양한 테스트를 진행하고 있다.

이런 기술들이 실제 서비스에 적용되면 지역 정보 검색 결과에 실시간성이 가미되며 '지금'에 근거한 '필요한' 정보들이 더욱 잘 노출될 것으로 기대된다.

■모바일에서 '지금'의 관심사 즉시 반영

네이버는 모바일에서 정보의 최신성이 더욱 중요해짐에 따라, 현재 화제가 되는 정보를 보다 잘 찾아줄 수 있는 검색엔진으로 한 단계 더 진화하기 위한 기술을 개발하고 있다.

네이버는 '지금의 관심사'를 더욱 빠르게 검색결과로 제공하기 위해, 'RED(Realtime Event Detection)' 시스템을 개발했다.

이 시스템을 검색에 적용하면 블로그·SNS·뉴스·이미지 등 다양한 문서로부터 일반적인 트래픽 범주를 넘어서는 특이사항이 발생한 것을 실시간 이슈로 탐지한다. 지금 웹상에서 벌어지는 주요 관심사를 자동으로 추출해 검색 결과로 제공할 수 있으며, 이용자 반응도 즉각적으로 검색결과에 반영될 수 있다.

평소에는 '종합운동장'의 검색결과로 종합운동장의 정의·역사 등의 정보가 노출됐다면, 프로야구 개막전 등 관심이 높은 경기가 개최되는 날에는 현재 경기 중인 야구 경기의 결과에 대한 뉴스·SNS·블로그 등에 올라온 이용자 반응이 일목요연하게 정렬·노출되는 식이다.

또 RED 시스템은 검색 키워드에 대한 이용자 반응(게시글)을 단순히 시간순으로 정렬하는 것이 아니라, '이용자 관심'도 함께 반영한 '현재' 관심 결과를 나타낼 수 있도록 고안됐다.

예를 들면 부산 사직구장 검색 시, 가장 최근에 사직구장 전경 이미지가 올라왔더라도 이용자들이 그보다는 먼저 올라왔던 사직구장에서 경기 중인 A팀의 안타 소식을 더 선호한다면 해당 게시글이 우선 노출되는 방식으로 시스템이 작동한다.

특정 이슈에 대한 다른 사람들의 현재 반응에 능동적으로 참여할 경우, 검색결과가 이를 즉각 반영할 수 있는 REACT(REaltime ReACT) 시스템도 도입했다. REACT 시스템을 통해 이용자들의 현재 이슈에 대한 반응을 즉시 검색결과에 반영하며 '리얼타임 검색'의 즉시성을 더욱 강화할 수 있게 됐다.

REACT 시스템에는 사용자의 반응이 즉시적으로 검색 랭킹에 반영되는 ‘스냅 랭크’(Snap Rank)라는 새로운 검색 모델로 테스트를 진행하며 검색 품질을 점검하고 있다.

■이미지·동영상 검색결과, 유사항목별로 재구성

네이버는 모바일 시대를 맞아 폭증하고 있는 이미지, 동영상들이 어떤 규칙이나 패턴 없이 단순히 나열되는 방식에 머물러 있다는 판단이다. 이에 따라 사진과 동영상들을 의미있게 분석하고, 효과적으로 정리해 사용자들에게 제공하기 위한 ‘비주얼 서머리제이션’(Visual Summarization) 기술도 테스트 중이다.

비주얼 서머리제이션은 딥러닝 기술을 활용해 유사한 이미지 간의 클러스터링 과정을 거쳐 대표 이미지를 자동으로 추출하고, 거기에 문서의 출처 분석을 통해 최종적으로 노출 랭킹을 정하는 방식이다.

이를 활용하면 다양한 멀티미디어 형 콘텐츠들이 단순 나열이 아닌, 유사 항목별 등으로 의미있게 정렬된다. 예를 들면 음식점을 검색하면 음식·식당 인테리어·메뉴판 등으로 자동 분류 및 나열됨으로써, 이미지와 동영상 검색결과가 또 다른 정보로서의 가치를 더할 수 있게 된다.

관련기사

특히 사람이 포함된 사진의 경우 얼굴과 신체 영역을 정확히 인식해 사진이 담고 있는 내용을 왜곡하지 않으면서도 다양한 사진을 직관적으로 요약해 배치할 수 있도록 지능적인 크롭핑과 배열 기술도 함께 개발 중에 있다.

참고로 모바일 네이티브 세대들은 좁은 모바일 화면에서 정제된 텍스트로 의미를 전달하기 보다는 사진과 같은 비언어적 요소로 의미를 전달하며 소통하고 있다.