알고나면 더 재미있는 ‘숫자로 된 일상의 법칙들’

김성태 교수의 [데이톨로지]⑨ 데이터 미학- ‘수’로 나타난 삶의 패턴

전문가 칼럼입력 :2021/07/05 10:07    수정: 2021/07/06 09:59

김성태 고려대 미디어학부 교수
김성태 고려대 미디어학부 교수

바야흐로 데이터 시대다. 지금 우리는 빅데이터, 인공지능(AI), 블록체인 등 디지털 데이터를 기반으로 한 4차산업혁명을 목도하고 있다. 인류가 문자와 기호를 사용하기 시작한 지난 5천년 동안 문명의 흐름이 지구촌 곳곳에서 큰 강을 이루고 이제는 모이는 바다에 이르렀다. 데이터가 원유가 되어 모든 것이 돌아가는 시대가 된 것이다. '데이톨로지(Datalogy)' 사상의 연원(淵源)이다. 데이터에 대한 철학적, 인문학적, 과학적인 성찰의 결과라 봐도 좋을 것이다. 데이터와 관련된 키워드를 중심으로 제4차산업혁명의 시대를 살고 있는 우리의 다양한 호기심을 자극하는 지적 탐구의 장을 마련다. 이번에는 가벼운 브런치 같은 느낌으로 데이터 분석을 통해 발견된 재미있는 일상의 법칙들을 소개한다. <편집자>

0.017초

숫자 자료사진(제공=픽사베이)

사람을 처음 만났을 때나 백화점에서 찾는 물건을 봤을 때 우리의 뇌는 순간적으로 작동하기 시작한다.

보통 ‘첫인상’이라고 부른다. 미국 다트머스 대학의 뇌과학자이자 심리학자인 폴 왈렌(Paul J. Whalen) 교수의 연구에 따르면 우리 뇌에서 새로운 것의 학습이나 감정 정보를 처리하는 편도체(amygdala)가 시각적으로 첫인상을 형성하는데 걸리는 시간이 (17/1000)초, 즉 0.1초도 안 된다.

심리학에서는 '초두효과(Primary Effect)'라는 개념이 있다. 처음 입력된 정보가 나중에 습득된 정보보다 평가 과정에서 더 강한 영향력을 발휘한다는 것인데, 첫인상이 왜 중요한지를 잘 설명해준다. 우리 뇌는 아주 찰나의 시간에 본능적으로 상대방에 대한 호감 여부를 결정하고, 이 순간적인 판단이 한번 형성되고 나면 바꾸기가 쉽지 않다고 한다.

심리학자 솔로몬 애쉬(Solomon Asch)는 흥미로운 실험을 진행했는데, A와 B 두 사람의 성격에 대한 정보를 사람들에게 다음과 같은 순서로 제시했다.

-A는 “똑똑하다, 근면하다, 충동적이다, 비판적이다, 고집스럽다, 질투심이 많다.”

-B는 “질투심이 많다, 고집스럽다, 비판적이다, 충동적이다, 근면하다, 똑똑하다.”

그런 다음 A와 B에 대해 어떻게 생각하느냐를 실험 참가자들에게 물었는데, A에 대해서 더 긍정적인 반응을 보였다고 한다. 실험은 A와 B에 관해 제시된 정보들의 순서만 다를 뿐 내용은 똑같았다. 그러나 긍정적인 정보를 먼저 제시한 A에게 초두효과가 작용해 B보다 더 좋은 평가가 내려진 것이다.

한편 부정적 첫인상은 편도체에 더 오래 기억된다는 연구 결과도 있는데, 0.017초에 형성된 좋지 않은 첫인상을 바꾸기 위해서는 추가적으로 200배의 긍정적 정보량이나 또는 60번의 좋은 만남이 필요하다고 하니 얼마나 찰나에 만들어진 첫인상이 중요한가를 알 수 있다.

또 다른 재미있는 사실은 개인이 사적으로 만나는 경우가 아니라 유명 셀럽에 대한 평가에서는 초두효과보다는 가장 최근에 입력된 정보가 호감을 결정하는데 더 중요하게 작동한다는 점이다. 미디어 사회학에서 많이 연구되어지는 ‘점화 효과’라고 불리는 ‘프라이밍이론(Priming Theory)’이다.

예를 들어 대통령 지지도는 거의 매주 실시되는데, 첫인상이나 오랜 기억보다 가장 최근의 대통령과 관련한 정보를 바탕으로 평가가 주로 이뤄진다는 것이다. 그렇기 때문에 대통령지지도 추이는 대통령의 최근 활동에 따라서 매주 등락폭이 달라질 수 있는 것이다. 첫인상과 호감의 평가가 나와 개인적인 관계를 맺고 있는 것인지 아니면 공적인 제3자인지에 따라 다를 수 있음을 보여준다.

1

세상에 존재하는 수많은 ‘수’ 가운데 어떤 숫자로 시작하는 게 가장 많을까? 예를 들면, 응급신고 전화번호인 ‘119’의 시작 숫자는 ’1’이다. 어쩌면 이 질문에 대해 먼저 드는 생각은 확률적으로 1부터 9까지의 숫자가 대략 비슷한 비율로 나오지 않을까다.

1938년에 발표된 미국의 물리학자 프랭크 벤포드(Frank Benford)의 연구에서 재미있는 결과가 소개됐다. 그는 20개의 대규모 자료집에 있는 모든 수의 빈도를 비교 분석했는데, 포함된 데이터는 335개 강의 표면적, 104개의 물리학 상수, 1천800개의 분자 무게, 5천개의 수학책에 나오는 숫자, 308개의 잡지 ‘리더스 다이제스트’에 나오는 숫자 등이었다.

분석 결과, 매우 흥미롭게도  ‘1’이 가장 높은 비율로 나타났고, 그 다음이 ‘2’, 다음이 ‘3’, ‘4’ 등의 순이었는데, 숫자가 높아질수록 일정한 비율로 감소하는 패턴을 보였다는 것이다. 그의 이름을 따서 ‘벤포드의 법칙’으로 불린다.

벤포드의 법칙에서 첫 ‘숫자’의 비율적 패턴결과 (출처: 구글이미지)

벤포드가 이를 발표한 뒤 여러 연구자들의 추가적인 분석에서도 이런 분포 규칙이 나타났는데, 예로 건물들의 높이, 주소의 번지, 전기세, 주식 가격, 집값, 인구 통계 등에서 비슷한 결과 패턴을 보였다.

가장 최근에는 2015년 ‘MIT 테크놀로지 리뷰’에 발표된 미국 메릴랜드 대학교 제니퍼 골벡(Jennifer Golbeck) 교수팀의 연구였는데, 페이스북, 트위터와 같은 SNS 계정들에서의 팔로잉 혹은 팔로워의 숫자 등과 벤포드 법칙에서 제시된 숫자 분포와의 상관 관계 분석에서 평균 0.9 이상의 상관계수를 보였다고 발표했다.

흥미로운 사실은 벤포드의 법칙이 빅데이터 시대에 더 유용성이 커질 수 있다는 점이다. 최근 대규모 숫자로 이뤄진 금융 데이터 등에서 조작과 진위 여부를 판별할 때 사용되기도 한다는 것이다. 숫자의 분포가 통상 벤포드 법칙을 따르는 경우가 많지만, 때로는 전체 숫자 데이터에서 1부터 9까지 숫자가 비슷한 비율로 등장하는 경우에는 누군가가 조작하거나 허위로 만들어낸 ‘가짜 숫자’일 가능성이 높아진다는 것이다.

8초

글로벌 기업인 마이크로 소프트는 지난 2015년 디지털 기술이 가져온 미국인들의 삶의 변화에 대한 대규모 연구에서, “미국인들이 평균 집중할 수 있는 시간은 금붕어보다도 짧은 단 8초(The average American’s attention span is only 8 seconds -- less than a goldfish)”라는 재미있는 결과를 발표했다.

이 수치는 그 전 10년 전의 유사한 조사에서 발표됐던 미국인들의 평균 집중시간 ‘12초’와 비교해서도 크게 줄어들었는데, 그 이유로 스마트폰으로 대표되는 디지털 기기로 인해 더 바빠지고 집중하기 힘든 환경이 되었음을 지적했다.

또한 2017년 베스트셀러 작가인 폴 헬먼(Paul Hellman)은 ‘상대의 마음을 바꾸는 기적의 8초(You’ve got 8 seconds)’라는 저서에서 상대를 설득할 수 있는 성공적인 커뮤니케이터가 되기 위해서는 사람들이 가장 집중하는 첫 8초의 중요성을 재차 강조했다.

지금 만약 여러분이 회사에 입사하기 위한 인터뷰에서 8초 내에 심사위원들에게 강한 임팩트를 주거나, 옷을 파는 가게에서 고객들의 시선을 8초 내에 끌어내야 그들의 마음을 움직일 수 있다는 것이다. 국내 의류 브랜드인 ‘에잇세컨즈’는 어쩌면 고객을 마음을 훔치는 이 시간을 의미하며 이름을 붙이지 않았나라는 생각이 든다.

여러분들이 많은 사람들 앞에서 발표를 한다고 했을 때도 첫 8초 내에 청중의 마음을 움직여야 한다. 그래서 미국의 유명 동영상 콘텐츠인 TED에서는 강연자들에게 표나 그래프를 보여주면서 시작하지 말고 이야기, 대담한 선언, 질문 등으로 시작하라고 조언한다.

‘8초’의 중요성은 다른 분야의 연구에서도 증명됐다. PGA투어 프로 골퍼인 마이크 벤더(Mike Bender)와 마이클 메르시에(Michael Mercier)는 저서 ‘골프의 8초에 얽힌 비밀: 위대한 챔피언들의 특징’에서 명예의 전당에 들어간 골퍼들의 특징을 분석했는데, 대회에서 우승한 챔피언들은 샷을 하기 위해 어드레스를 잡고 들어가서 평균 8초 정도에 스윙을 마쳤다고 한다.

그들에 따르면 대부분의 프로 또는 일반 골퍼들은 8초보다 훨씬 더 긴 시간을 스윙을 위해 사용하는데, 이로 인해 집중력이 떨어지게 되고 좋은 샷을 만들 수 없으며 특히 중압감이 높은 상황에서는 시간이 길어질수록 실수 가능성이 더 높아진다는 결과를 발표했다. 이는 사람들의 초집중 가능 시간이 8초 내외라는 마이크로소프트 연구결과와 일맥상통하는 얘기다.

2:8

20세기 초 이탈리아의 경제학자인 빌프레도 파레토(Vilfredo Pareto)는 당시 이탈리아와 유럽의 여러 나라들에 대한 연구에서 인구의 20%가 전체 부의 80%를 소유하게 되는 부의 불평등한 분포 상황을 알게 된다.

그리고 이런 패턴이 인간 사회 뿐만 아니라 동식물의 생태계에서도 존재함을 추가적으로 발표하였다. 파레토는 개미들의 습성을 연구하다가 전체 개미 중 20% 정도만이 열심히 일하고 나머지 80%는 움직임이 많지 않다는 사실을 알게 된다.

그런 다음 열심히 일하는 개미 무리들만 따로 분리해서 다시 관찰을 했는데, 열심히 일했던 개미 무리에서도 시간이 지나면서 소수만 일을 하고 대부분은 다시 놀기 시작한다는 흥미로운 결과를 얻게 된다. 식물을 대상으로 하는 연구에서도 밭에 심은 완두콩 씨앗의 20%에서 전체 수확량의 80%가 생산된다고 사실을 발견하게 된다.

그 이후, 미국의 경영학자인 조셉 주란(Joseph Juran)은 파레토의 연구를 바탕으로 기업의 성과에서도 소수의 엘리트가 전체 매출의 대부분을 책임진다는 주장을 하면서 ‘20:80’ 혹은 ‘2:8’의 ‘파레토 법칙(Pareto Principle)’은 세상에 널리 알려지게 된다. 최근까지 이 법칙은 우리 사회의 다양한 영역에서 적용돼 왔는데 대표적인 예는 다음과 같은 것들이 있다.

-20%의 고객이 백화점 전체 매출의 80%를 차지한다.

-즐겨 입는 옷의 80%는 옷장에 걸린 옷의 20%에 불과하다.

-전체 주가상승률의 80%는 상승기간의 20%의 기간에서 발생한다.

-20%의 범죄자가 80%의 범죄를 저지른다.

-성과의 80%는 근무시간 중 집중력을 발휘한 20%의 시간에 이루어진다.

-우수한 20%의 인재가 80%의 문제를 해결한다.

-운동선수 중 20%가 전체 상금 80%를 가져간다.

매출량 구성에서 파레토의 법칙과 롱테일 법칙 (출처: 구글이미지)

그러나 파레토 법칙에 대한 관심은 최근 고객에 대한 빅데이터를 기업에서 구축하기 시작하면서 롱테일(Long-Tail) 법칙으로 옮겨가게 된다.

‘롱테일’은 파레토 법칙을 그래프에 나타냈을 때 꼬리처럼 긴 부분을 형성하는 80%의 부분을 일컫는데, 2004년 ‘와이어드’라는 매거진에서 크리스 앤더슨(Chris Anderson)에 의해 처음으로 소개됐으며 이후 ‘롱테일 경제학’이란 책에서 이 개념은 본격적으로 알려지고 다양한 영역에서 적용되기 시작했다.

크리스 앤더슨은 온라인 서점 ‘아마존’의 매출 데이터를 분석하면서, 1년에 소량만 팔리는 비인기 서적의 매출 총액이 소수의 베스트셀러 매출 총액보다 더 많은 사실을 발견한다. 그래서 빅데이터를 활용하면 그동안 주목받지 못했던 고객들의 기호를 파악해 기존에 출시돼 잘 알려지지 않고 창고에 쌓여 있던 책이나 새롭게 출시되는 신서적을 추천함으로써 전체 매출을 더 늘릴 수 있다는 주장을 하게 된다.

한 예로, 기업의 마케팅 전략에서도 그동안 20%의 VIP에 집중했다면 이제는 고객 빅데이터를 활용한 80%의 이름 없던 긴꼬리(long-tail) 부분에 대한 마켓팅이 더 중요해질 수 있음을 강조한 것이다.

1:29:300

최근 미국 마이애미 해변가에서 오래된 아파트가 붕괴되는 사고가 있었다. 그런데 사고 바로 직전에도 이 아파트에 거주하는 주민들의 불만 민원이 매우 많았다는 언론 보도를 접하면서 혹시나 미리 신경을 썼으면 예방도 가능하지 않았을까 하는 안타까움이 생겼다.

우리나라도 지난 1990년대 중반에 발생한 삼풍백화점과 성수대교 붕괴나 2014년에 일어난 세월호 침몰 사건은 대형 참사로서 아직도 많은 사람들의 아픈 기억으로 남아 있다.

허버트 하인리히(Herbert Heinrich)는 1931년 ‘트래블러스’ 보험사에서 통계 분석가로 일하며 과거 보험금이 많이 지출된 사건에 대한 데이터를 접하면서, 사고에도 일정한 법칙이 있음을 발견한다.

그런 다음 ‘산업재해예방(Industrial Accident Prevention)’이라는 제목의 책을 출간하면서, 한 번의 큰 재해가 발생하면 그 전에 29건의 소형 사고가 일어나고, 또 그 전에는 300번의 사전 징후가 나타난다고 적었다. 또한 이런 사고 발생 패턴을 잘 이해하고 미리 보여지는 징후를 주의 깊게 관찰할 수 있다면 사건과 재앙을 미리 예방할 수 있다고 주장했다.

‘1:29:300’이라 불리는 하인리히의 법칙 (출처: 구글이미지)

‘1:29:300’이라고 불리는 ‘하인리히의 법칙’이다. 물론 모든 사건, 사고들이 정확하게 이 수치대로 발생하지는 않을 것이다. 그러나 분명한 것은 갑자기 발생하는 사고는 많지 않다는 사실이다. 이런 법칙은 기업이나 조직 혹은 국가 차원에서 곧 닥칠 재난을 예방하기 위해서도 필요하지만, 각자 개인의 일상 삶에서도 건강문제나 사람들과의 관계에서도 의미있는 인사이트를 제공한다고 볼 수 있다.

향후 빅데이터의 시대가 더 가속화되면서 이 하인리히의 법칙은 미래에 닥칠 위험을 예측하기 위한 더 유용한 분석틀이 될 수 있을 것으로 기대된다.

1만 시간

지난 1993년 저명한 학술지인 ‘심리학평론(Psychological Review)’에는 앤더스 에릭슨(K. Anders Ericsson)과 랄프 크램페(Ralph Krampe) 등의 연구 ‘전문역량 습득과정에서의 연습의 중요성’이라는 논문이 발표됐다.

주요 내용을 살펴보면, 연구자들은 우선 독일 서베를린 음악 아카데미에 입학한 20살 전후의 바이올린 전공자 학생들을 담당 교수들의 평가를 바탕으로 세 그룹 (매우 우수 vs. 우수 vs. 평범)으로 나누게 된다. 그런 다음 각 학생 그룹들이 지금까지 얼마나 많은 연습을 했는지를 물어 평균 시간을 도출했다.

매우 우수한 그룹은 1만 시간에 가까웠던 반면에, 우수한 그룹은 7~8천 시간, 평범한 그룹의 경우는 3~4천시간 정도를 연습했다는 흥미로운 결과를 발표했다. 물론 연습량이 많을수록 실력이 향상되는 것은 상식적으로 당연했지만, 이 연구가 훌륭한 바이올린 연주 실력을 갖추기 위해 어느 정도의 연습시간이 필요한지를 매우 구체적으로 제시했기에 많은 관심을 받았다.

이후 2008년에 베스트셀러 작가인 말콤 글래드웰(Malcolm Gladwell)은 저서 ‘아웃라이어(Outlier)’를 출간했다. 그는 아웃라이어를 “보통사람의 범주를 넘어선 성공을 거둔 사람”으로 정의하며, 평범하지 않은 천재들과 성공한 인물들의 특징을 집중적으로 분석 하게 된다. 흔히들 통계학에서 사용되는 개념인 ‘아웃라이어’는 평균을 중심으로 분포된 대다수의 사람들과 확연히 구분되는 바깥쪽 측정치를 일컫는다.

그는 사람들이 성공을 거두기 위해서는 우호적인 환경, 타고난 재능뿐만 아니라 남들보다 훨씬 더 많은 시간적인 연습도 필요하다고 적었다. 예로, 비틀즈가 세계적인 그룹이 되기 위해서 어느 정도 많은 시간을 연습했는지, 그리고 스티브 잡스나 빌 게이츠가 자신이 좋아하는 일을 위해 학교를 중도에 그만두면서까지 얼마나 많은 시간을 투자했는지 등을 적고 있다.

그런 다음 위에서 언급한 에릭슨 등의 연구를 바탕으로 “1만 시간을 연습하면 한 분야의 전문가가 될 수 있다”고 주장하게 됐는데, 이것이 ‘1만 시간의 법칙’으로 널리 알려지게 된다. 어쩌면 이 법칙은 성공 가능한 수준에 오르기까지 필요한 절대적 전제 조건은 아닐지라도 상대적으로 성공 가능성을 높여줄 수 있는 노력의 정도를 상징화한 표현이 아닌가 싶다.

한편 필자는 성공을 위한 ‘1만 시간의 노력’을 얘기할 때, 신입생으로 입학하는 제자들에게 꼭 하는 얘기가 있어 여기서 공유하고자 한다.

대나무 자료 사진(제공=이미지투데이)

중국 극동지역에서 자라는 일명 모죽(毛竹)이라 불리는 ‘모소대나무’가 있다. 이 대나무는 모종을 한 후 4년 동안 아무리 거름과 물을 주어도 약 3cm밖에 자라지 않는다. 하지만 5년째가 되는 해부터 손가락만 하던 죽순이 순식간에 커지기 시작하는데, 심지어는 하루에 30cm 가까이 자라기도 한다. 그런 다음 2달쯤 지나면 15m 이상씩 자라서 텅 비어있던 산이 울창한 대나무 숲으로 변한다고 한다. 영화 ‘와호장룡’에서 무사들이 공중 대결하는 장면에 등장하는 엄청난 높이의 대나무도 모죽이다.

그렇다면 왜 모소대나무는 첫 4년간 성장이 멈춰 있었던 것일까? 여기에 의문을 품은 전문가들이 땅을 파 보았더니 대나무의 뿌리가 사방으로 어떤 경우는 수백미터까지 뻗어 내려 땅속 깊숙이 자리를 잡고 있었다고 한다. 지난 4년 동안 전혀 자라지 않은 것처럼 보였지만 모소대나무는 세상에서 가장 큰 대나무로 성장하기 위한 준비 시간을 가졌던 것이다. 그렇게 단단하게 뿌리를 내렸기 때문에 5년차부터 하루에 30cm가량 쑥쑥 자라도 그 성장의 무게를 견딜 수 있게 된 것이다.

김난도 교수가 쓴 저서 ‘천 번을 흔들려야 어른이 된다’에서도 이에 관한 이야기가 나온다.

“견디십시오. 그대는 모죽(모소대나무)입니다. 비등점을 코앞에 둔 펄펄 끓는 물입니다. … 곧 그 기다림의 값어치를 다할 순간이 올 것입니다. 세상에서 가장 높은 대나무로 쑥쑥 커갈 시간이 올 것입니다. 자유로운 기체가 돼 세상을 내려다볼 시기가 올 것입니다.”

관련기사

우리 주변을 보면 고시를 준비하거나, 좋은 기업에 들어가기 위해서나, 자기 분야에서 박사학위를 받거나, 혹은 자신이 창업한 사업을 시작할 때에 어쩌면 ‘1만 시간’의 투자는 성공을 위한 하나의 상징처럼 보인다.

어쩌면 모소대나무 이야기는 꿈을 이루기 위해 하루에 8시간씩 4년 동안 최선을 다해 준비한다면, 1만 시간의 이 노력이 여러분들에게 성공의 가능성을 높여줄 수 있다는 의미 있는 메시지를 던져 주는 듯하다.

*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.

김성태 고려대 미디어학부 교수

현재 고려대 ‘빅데이터 사회문제 연구센터’를 운영하며, 데이터를 통한 통찰력 있는 세상 읽기와 (빅)데이터 분석을 통한 다양한 사회 문제 솔루션 도출에 관심을 갖고 있다. 이번 '데이톨로지' 연재는 인류의 역사, 철학사상 그리고 다양한 인문학적 논쟁의 패러다임속에서 데이터 자체의 미학, 역사속의 위대한 데이터 분석가, 디지털데이터가 만드는 새로운 현상과 문화를 최근 사례와 함께 소개함으로써 미래의 성장동력으로서의 (빅)데이터의 가치를 재발견하고, 독자들에게 ‘디지톨로지Digitalogy’ ‘데이톨로지Datalogy’ ‘데이터빌리티Datability'의 중요성에 대한 토론의 장이 되기를 기대한다.