‘별점’의 해결책 "집단지성 메커니즘 제대로 작동해야"

김성태 교수의 [데이톨로지]④ ‘별점의 딜레마 2’

전문가 칼럼입력 :2021/05/31 15:40    수정: 2021/05/31 20:48

김성태 고려대 미디어학부 교수
김성태 고려대 미디어학부 교수

바야흐로 데이터시대다. 지금 우리는 빅데이터, 인공지능(AI), 블록체인 등 디지털 데이터를 기반으로 한 4차산업혁명을 목도하고 있다. 인류가 문자와 기호를 사용하기 시작한 지난 5천년 동안 문명의 흐름이 지구촌 곳곳에서 큰 강을 이루고 이제는 모이는 바다에 이르렀다. 데이터가 원유가 되어 모든 것이 돌아가는 시대가 된 것이다. '데이톨로지(Datalogy)' 사상의 연원(淵源)이다. 데이터에 대한 철학적, 인문학적, 과학적인 성찰의 결과라 봐도 좋을 것이다. (빅)데이터와 관련된 키워드를 중심으로 제4차산업혁명의 시대를 살고 있는 우리의 다양한 호기심을 자극하는 지적 탐구의 장을 마련한다. 이번 글은 지난호에 이어 ‘별점의 딜레마’에 대한 해결책으로 ‘집단지성’의 힘을 전제로 데이터 분석차원에서의 노력과 최근 시도되고 있는 대안적 솔루션을 소개한다. <편집자>

"여러분들은 만약 퀴즈대회에서 매우 어려운 문제를 접했을 때, 여러분이 알고 있는 가장 똑똑한 친구한테 전화를 걸 수 있거나, 혹은 퀴즈 대회에 관객으로 참가중인 다른 100명에게 물어볼 수 있는 기회가 있다면 둘 중 어떤 선택을 하시겠습니까."

제임스 서로위키(James Surowiecki)는 2004년 발간한 저서 ‘군중의 지혜’(The Wisdom of Crowds)에서 ‘백만장자 퀴즈쇼’(Who wants to be a millionaire?)의 예를 들면서, 퀴즈대회 참가자들이 쓴 위의 찬스를 분석한 결과 한 명의 아는 전문가가 맞춘 확률은 65%정도였던 반면, 관객 다수가 선택한 답이 맞았던 경우는 90%가 넘었다고 소개했다.

퀴즈 자료사진(제공=픽사베이)

미국의 곤충학자 윌리엄 모턴 휠러(William Morton Wheeler)는 1910년 출간한 ‘개미’에 관한 관찰 보고서에서 개미가 공동체로서 협력해 거대한 개미집을 만드는 것을 보고 개미는 개체로서는 미미하지만 군집할 경우 높은 지능체계를 보여준다고 설명했다.

비슷한 시기인 1907년 영국의 과학자이며 통계학자인 프랜시스 갈턴(Francis Galton)은 여행 중 어느 시골의 가축 품평회 행사에 참가하게 됐다. 여기서 큰 황소의 몸무게를 알아맞히는 대회가 열렸는데, 참가비를 내고 소의 무게를 적어 내서 가장 근접한 사람에게 소를 상품으로 주는 행사였다. 결과는 희한하게도 정확히 맞힌 사람은 하나도 없었다. 그런데 몸무게를 적어난 787장의 표에 적힌 무게를 평균했더니 1197파운드였고, 실제 측정한 소의 무게는 1198파운드였다고 한다.

최근 인터넷의 발달로 인한 새로운 소통이 가능해진 상황에서 사회학자 피에르 레비(Pierre Levy)는 온라인상에서의 집단지성의 역할을 강조하며 “그것은 어디에나 분포하며, 지속적으로 가치가 부여되고 실시간으로 조정되며, 역량의 실제적 동원에 이르는 지성”이라고 정의하기도 했다.

이 모든 것이 ‘집단지성(Collective Intelligence)'의 발견이고 또한 힘이다. 다수의 개체들이 서로 협력 혹은 경쟁을 통해 얻게 되는 통합된 지성이 소수 전문가의 능력보다 올바른 결론에 가깝다는 주장이다

이용자들의 참여로 시작된 별점제도는 이러한 ‘집단지성’ 메커니즘을 전제로 작동된다. 인터넷과 디지털 기술을 통한 상호 소통이 만들어 내는 ‘집합적인 지능정보’의 결과가 별점인 것이다. 문제는 별점이 소비자들의 주관적인 평가의 단순한 총합만이 아니라 시장에서 하나의 ‘권력’ 역할을 하고 있다는 사실이다.

이제는 이 시스템의 문제가 무엇인지를 정확히 인식하고 최적의 해결책을 찾기 위한 노력이 절실할 때다. 특히 그 힘이 제대로 사용되지 않을 때에 시장을 교란하고 소비자들에게 사회적 비용을 지출하게 만드는 더 큰 문제를 야기 시킬 수도 있기 때문에 더욱 그렇다.

필자는 본 연재글을 위해 스마트폰으로 제품 구매나 정보 찾기를 가장 활발히 하는 젊은 세대들이 ‘별점’ 정보를 어떻게 이용하고 있는지를 알아보기 위해 121명의 20~30대 대학생과 대학원생들을 대상으로 간단한 서베이를 실시했다.

‘별점’ 정보를 어떻게 이용하고 있나요? 설문조사 결과

우선 별점 이용정도를 묻는 7점 척도 문항들에서 ‘배달서비스’(6.08), ‘맛집/레스토랑’(6.07), ‘숙박장소’(5.73), ‘영화/공연’(5.36), ‘신상브랜드’(5.36) 등의 순으로 별점 의존도를 보였다. 일상에서의 거의 모든 정보탐색 과정에서 ‘별점’을 참고하고 있는 것처럼 보였다.

흥미로운 점은 새로운 제품이나 서비스 구입 결정을 하기 전에 '별점을 참고 한다'는 질문에는 ‘5.8점’을 기록한 반면, '가족이나 친구의 의견을 먼저 구한다'에는 ‘5.6’점이 나와 거의 비슷했지만 별점 정보를 조금 더 우선시 하고 있다는 사실이다. 이는 ‘제품 구매 시 가장 우선적으로 참고하는 정보원’에 대한 글로벌 소비자 조사기관인 닐슨의 2016년 조사결과와 거의 유사하다. 소비자들이 구매를 결정하기 전에 온라인상에 존재하는 별점과 같은 다양한 타인들의 평가정보가 가장 중요한 정보원이라는 것이다.

또 다른 문항에서 ‘별점이나 후기 댓글 작성’ 참여 여부에 대해 물었는데, 많은 응답자가 경험이 있다고 답을 했다(5.23점). 그런데, 별점이 어떻게 계산돼 제시되는지의 ‘방법적 알고리즘’에 대해 알고 있는지에 대해서는 ‘3.6’점으로 매우 낮게 나타났다. '우리나라 별점제도에 문제가 많다고 생각하느냐'에 대한 문항에는 필자의 예상과는 달리 ‘4.2’로 심각하게 생각하지 않는 걸로 나타났다.

이런 결과는 별점 시스템이 어떻게 작동되며 또한 생길 수 있는 부작용에 대해 크게 생각하지 않고 있음을 간접적으로 보여준다고 유추할 수 있겠다.

마지막으로 '앞으로도 계속 별점과 후기댓글을 이용할 것인가'에 대한 질문은 ‘6.1’로 매우 높은 결과치가 나왔다. 이는 최근 별점 제도의 폐해에 대한 많은 비판에도 불구하고 소비자들에게 별점이 여전히 지속적으로 사용되어질 가능성이 많음을 보여준다.

별점 리뷰(제공=픽사베이)

서베이 결과를 간추리면, 대학교에 있는 젊은 친구들의 경우 제품이나 다양한 서비스를 이용하기 전에 별점 정보를 매우 많이 이용하고 있는 반면, 별점의 다양한 문제점에 대해 별로 심각하게 고민하지 않고 있으며, 앞으로도 별점을 계속 이용할 의향이 많다는 사실이다.

이런 결과를 고려하면 지금이라도 보다 정확한 ‘별점’시스템이 필요하며, 별점 조작이나 테러와 같은 여러 가지 폐해들을 해결하기 위한 다각적인 노력이 더 절실해 보인다. 또한 향후 지속적인 이용을 원하는 비율이 높은 점을 생각하면 이 시스템을 무작정 없애기 보다는 문제점을 최소화하는 방향으로 개선하는 것이 더 낫다.

그렇다면 앞으로 어떻게 하는 게 좋을까. 최근의 사례를 먼저 살펴보자. 글로벌 미디어 기업인 넷플릭스는 5점 별점 시스템을 폐지하는 대신 보다 간단하게 엄지 아이콘을 이용한 ‘좋아요/별로예요’ 추천시스템을 도입했다. ‘좋아요’를 선택할 경우는 콘텐츠가 마음에 들기에 비슷한 다른 콘텐츠를 추천 받고 싶다는 의미다.

반면 ‘별로예요’는 시청한 콘텐츠가 재미없었기에 비슷한 콘텐츠에 대한 추천을 중단해 달라는 메시지다. 또한 사람들은 ‘좋아요’ 수치를 통해 이용자들의 콘텐츠에 대한 평가를 참고할 수 있게 된다. 또한 별점과 같은 점수시스템이 아니기에 조작이나 테러와 같은 문제는 줄어들 가능성이 커 보인다.

또한 추가적으로 각 콘텐츠 옆에 개인 맞춤형 ‘% 일치’ 점수를 표시하기 시작했는데, 이 수치는 ‘좋아요’ 관련 데이터를 추가 분석한 후 도출한 해당 이용자의 콘텐츠 선호도 예상치다.  넷플릭스가 ‘좋아요/별로예요’ 시스템으로 바꾼 후에 이용자들의 평가 참여율이 별점 때보다 200%나 증가한 것도 고무적으로 평가된다.

AI 기반의 ‘태그 구름’의 모습 / 네이버이미지

네이버도 지난 4월 23일 허위 댓글이나 악의적인 별점 테러 같은 것을 필터링하는 AI 기술을 적용하여 자사 서비스의 어뷰징을 막고 시스템을 개선해 나갈 예정이라고 발표했다. 식당, 카페 등 장소에 대한 ‘별점’평가를 없애고 새로운 평가 시스템인 ‘태그구름’을 올 하반기부터 제공할 예정이다. 또한 ‘마이 플레이스 이용 가이드라인’을 통해 그 동안 운용해 온 ‘영수증 리뷰’ 서비스 심사를 더 정교하게 강화하는데, 이는 별점이나 리뷰글 참여자에 대한 필터링을 통해 평가 결과의 신뢰성을 높일 수 있는 방법의 하나로 여겨진다.

제임스 서로위키(James Surowiecki)는 집단지성이 작동되기 위해서는 다음과 같은 4가지 조건이 우선적으로 필요하다고 지적했다. 먼저, 참가자의 범위가 제한적이지 않고 개방적인 다양성을 가져야 한다는 것이다. 다음으로는 개개인이 타인이나 주변에 의해 영향을 받지 않고 독립적으로 판단하거나 의견을 낼 수 있어야 한다. 또 의견의 조율과정에서 중앙집권적이 아니라 시스템이 분권화되고 분산돼 있어야 한다. 마지막으로는 다양한 개인들의 의견들이 쉽게 통합될 수 있는 기술적, 제도적 체제가 있어야 한다고 했다.

집단지성을 연구한 많은 학자들에 따르면 현실세계에서 위에서 언급한 다양한 조건들이 완벽하게 갖춰지기 힘들기 때문에 ‘집단지성’이 이상적으로 작동하지 않게 된다는 것이다. 따라서 완벽한 집단지성은 불가능에 가깝기 때문에 추가적인 보완책이 필요하다.

필자는 ‘데이톨로지’ 차원에서 데이터 수집과 분석과정에서의 몇 가지 제안을 하고자 한다.

먼저, 결과의 정확성은 분석데이터의 신뢰성과 분석과정의 엄밀성으로부터 생긴다. ‘집단지성’ 전제처럼 별점에 참여하는 이용자들의 수가 최소한의 기준은 넘어서는 경우만 별점이 제시돼야 한다. 아주 소수의 이용자 몇 명이 내린 허위나 극단적 평가에 의해 전체 별점이 좌지우지 될 수 있기 때문이다.

또한 별점 평가에 참여한 사람들의 수를 공개하지 않는 별점 시스템이 여전히 많은데, 소비자들이 대략 이용자 몇 명의 의견인지를 스스로 알 수 있게 해야 한다. 예를 들어, 선거 방송이나 보도에서 후보자들의 여론조사 결과를 보여줄 때 기본적으로 샘플의 크기나 표본오차 등을 포함시켜야 한다는 세칙이 있다. 별점이 가지는 엄청난 힘을 고려할 때 보다 객관적 지표가 되기 위한 최소한의 가이드라인이 필요하다.

또한 별점 시스템을 운영하는 포털이나 플랫폼에서는 다양한 업종이나 서비스의 별점이나 리뷰 관련 빅데이터를 갖고 있기에 이를 잘 활용하여 소비자들의 올바른 판단을 도울 수 있는 추가적인 정보를 제공할 수 있게 되기를 바란다. 예를 들면, 비슷한 업종이나 유형의 서비스중에서 현재 이 집 별점의 상대적 랭킹이 어떻게 되는지는 알려주는 것이다.

최근 텔레비전 오디션 프로그램에서 심사위원들의 평가 중에서 가장 높은 점수와 가장 낮은 점수를(통계학 용어로 아웃라이어) 빼는 것처럼, 극단적 평가(감정적 개입이 많을 수 있다는 전제)가 많이 발견될 경우 이를 제외시키거나 보정하는 추가적인 데이터 분석 작업도 유용할 듯하다.

이는 최근 이용 중인 이용후기 작성자의 아이디를 클릭하면 과거의 댓글수와 해당 업소를 이용한 횟수들을 알 수 있는 것과 마찬가지다. 이러한 정보를 좀 더 소비자들이 보기 쉽게 시각화(Visualization) 한다면 지금보다 훨씬 더 유용할 것이다. 작성자의 이용 후기글에서 어떤 표현이나 키워드 등이 많이 나왔는지를 정리해 주는 방법도 있을 수 있다. 이는 네이버의 해시태그 분석 방향과도 매우 비슷하다.

마지막으로 최근 인공지능 기술을 이용해 다양한 소비자 평가 데이터를 필터링하거나 분석하지만 여전히 인간이 사용하는 모든 언어적 표현, 특히 중의적인 단어나 신세대들이 끊임없이 만들어내는 신조어나 은어까지 AI기반 시스템이 완벽하게 분석한다는 것은 아직까지는 힘들다. 그런 점에서, 별점 평가나 이용후기를 작성하는 경우 그 자격조건을 더 명확하게 제시하고, 허위나 테러에 가까운 극단적 감정표현, 별점이나 후기 댓글을 매개로 불법거래를 줄일 수 있는 적절한 제도적 장치도 고민해 봐야 한다.

한편 허위나 문제가 있는 별점과 리뷰글을 발견했다고 하더라도, 이들도 현재의 방송통신법상 저작물에 해당되기에 작성자의 동의 없이 포털이나 플랫폼 사업자가 임의로 삭제할 수도 없는 문제도 여전히 있다.

별점은 순기능도 있지만, 위험과 함정도 많다. (제공=이미지투데이)

미국에서는 2016년부터 이에 대한 법안이 논의되기 시작하였는데, ‘소비자 리뷰 공정화에 관한 법안’를 마련해 별점 테러와 같은 매우 악의적인 리뷰를 정상적인 시장 교란행위로 규정해 강력하게 처벌하기 시작했고, 영국의 경우도 포털이나 플랫폼 운영자들이 별점이나 고객 리뷰를 어떻게 모니터링하고 관리해야 하는지에 대한 가이드라인을 만들어 운영하고 있다. 어쩌면 별점제도를 가장 많이 이용하고 있는 우리로서는 이에 대한 문제점과 개선책을 논의한다는 것이 사실 상대적으로 늦다고 볼 수 있다.

관련기사

필자가 느끼기에 오랜 역사를 자랑하는 별점 시스템은 분명 ‘오컴의 면도날’ 같은 매력도 있지만 별점이 갖는 힘으로 인한 위험과 함정도 많다. 이로 인한 사회적 이익보다 오히려 더 많은 사회적 비용을 지불할 수도 있을 것이다. 그러나 별점은 어쩌면 우리에게 좋고 나쁨을 따지기 전에 하나의 문화이자 컬트(cult)가 돼 사람들은 별점이 주는 심플한 달콤함 때문에 계속 이용을 하지 않을까 싶다.

이제는 수많은 소비자들의 목소리라는 ‘집단지성’을 전제로 해 시작한 이 시스템이 별점 테러나 악의적인 리뷰글로 인한 ‘집단감정’이나 ‘집단야성’으로 흘러가지 않도록 운영자나 소비자 모두의 노력이 필요할 때다. 별점 제도가 주는 ‘사회적 이익(Social Benefit)’이 ‘사회적 비용(Social Cost)’ 보다 더 커질 수 있도록 하기 위한 다양한 고민을  본격적으로 시작해야 한다.

*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.

김성태 고려대 미디어학부 교수

현재 고려대 ‘빅데이터 사회문제 연구센터’를 운영하며, 데이터를 통한 통찰력 있는 세상 읽기와 (빅)데이터 분석을 통한 다양한 사회 문제 솔루션 도출에 관심을 갖고 있다. 이번 '데이톨로지' 연재는 인류의 역사, 철학사상 그리고 다양한 인문학적 논쟁의 패러다임속에서 데이터 자체의 미학, 역사속의 위대한 데이터 분석가, 디지털데이터가 만드는 새로운 현상과 문화를 최근 사례와 함께 소개함으로써 미래의 성장동력으로서의 (빅)데이터의 가치를 재발견하고, 독자들에게 ‘디지톨로지Digitalogy’ ‘데이톨로지Datalogy’ ‘데이터빌리티Datability'의 중요성에 대한 토론의 장이 되기를 기대한다.