내 블로그 정체성, 빅데이터가 알려준다

인터넷입력 :2016/07/20 17:10    수정: 2016/07/20 17:46

네이버 블로그 포스팅을 기반으로 자신만의 키워드를 알려주는 '네이버 블로그 빅데이터 프로모션'에 참여한 이용자가 20만명에 도달했다.

20일 네이버에 따르면 지난 8일부터 진행한 이 프로모션은 그동안 블로그에 쌓아둔 지난 이야기를 돌아보는데 쓰이는 것뿐만 아니라, 개인 블로그만의 키워드를 뽑는데도 유용하게 활용되고 있다.

블로그 빅데이터 프로모션은 2003년부터 올해 6월까지 각 개별 블로그의 데이터를 빅데이터 분석과 자연어처리 기술을 활용해 의미있는 키워드와 관심 주제를 도출한 프로모션이다.

당초 이 프로모션은 한시적으로 운영될 예정이었으나, 네이버 측은 블로거들의 적극적인 참여와 반영에 힘입어 상시 운영으로 변경했다.

네이버 관계자는 무조건 블로그에서 많이 쓰였다고 해서 그 단어가 핵심 키워드로 뽑히는 것은 아니라고 설명했다. 빅데이터 분석을 통해 도출되는 키워드는 빈도 보다는 의미있게 쓰였는지의 여부가 중요하기 때문이다.

블로그 빅데이터 프로모션 담당자는 "'나는', '그래서' 와 같이 일상적으로 많이 쓰는 말 보다는 '빅뱅', '돼지고기'와 같은 엔터티(entity, 의미있는 정보의 단위)와 '국가장학금'과 같은 복합명사를 더 유의미하게 처리해 해당 블로그의 주요 키워드를 추출했다"며 "추출된 키워드들을 자동주제분류기술을 활용해 주제를 도출하는 방식으로 진행했다"고 설명했다.

이런 기술이 적용된 프로모션을 통해 네이버가 전체 블로그 포스팅을 본석한 결과, 요리와 레시피 분야에서는 돼지고기, 육수, 생크림이, 육아와 결혼 분야에서는 뽀로로, 돌잔치, 어린이집이 주요 키워드로 뽑혔다.

게임 분야에서는 스타크래프트, 메이플스토리, 서든어택이, IT와 컴퓨터 분야에서는 프로그램, 윈도, 프로세스가 가장 많이 언급됐다.

관련기사

스타나 연예인 분야에서는 소녀시대와 빅뱅, 아이유가, 패션 미용 분야에서는 오렌지, 틴트, 마스카라가 주요 키워드로 뽑혔다.

네이버 한성숙 서비스 총괄은 “네이버 블로그는 13년이라는 오랜 기간, 대한민국 인터넷 이용자들의 일상은 물론 사회적 주요 관심사와 해당 시대의 트렌드를 담아내는 온라인 플랫폼으로 자리잡아 왔다”며, “앞으로도 블로그에 자신의 소중한 이야기를 담는 이용자들이 다양한 방법으로 블로그에 쌓인 데이터를 돌아볼 수 있도록 적극 지원할 것”이라 말했다.