데이터 혁명의 보편언어 ‘0’·‘1’을 찾아서

김성태 교수의 [데이톨로지]⑩ 데이터 혁명사: 아라비아 숫자와 디지털 코드

전문가 칼럼입력 :2021/07/12 14:48    수정: 2021/07/12 20:42

김성태 고려대 미디어학부 교수
김성태 고려대 미디어학부 교수

바야흐로 데이터 시대다. 지금 우리는 빅데이터, 인공지능(AI), 블록체인 등 디지털 데이터를 기반으로 한 4차산업혁명을 목도하고 있다. 인류가 문자와 기호를 사용하기 시작한 지난 5천년 동안 문명의 흐름이 지구촌 곳곳에서 큰 강을 이루고 이제는 모이는 바다에 이르렀다. 데이터가 원유가 되어 모든 것이 돌아가는 시대가 된 것이다. '데이톨로지(Datalogy)' 사상의 연원(淵源)이다. 데이터에 대한 철학적, 인문학적, 과학적인 성찰의 결과라 봐도 좋을 것이다. 데이터와 관련된 키워드를 중심으로 제4차산업혁명의 시대를 살고 있는 우리의 다양한 호기심을 자극하는 지적 탐구의 장을 마련한다. 이번에는 인류에게 가장 중요한 ‘보편언어’로 자리 잡은 아라비아 숫자와 디지털 문명의 코드인 ‘0과 1’의 역사적 뿌리를 살펴본다. <편집자주>

‘보편언어(universal language)’로서의 ‘숫자’

“이 세상에 존재하는 다양하고 복잡한 개념과 수(數)를 가장 단순하게 나타낼 수 있는 ‘보편언어’는 있는 것일까?”

지금으로부터 약 450년 전에 우리가 사용하는 일상 언어의 모호함을 제거하고 모든 문화권에서 쉽게 사용할 수 있는 보편적 코드를 찾기 위해 끓임 없이 고민을 했던 한 젊은 철학자이자 수학자가 있었다. 독일의 고트프리트 라이프니츠(G. Wilhelm von Leibniz)가 그다.

라이프니츠의 초상화 (출처.=구글이미지)

라이프니츠는 1666년 출간한 저서 ‘조합의 예술에 관하여(On the Art of Combinations)'에서 세상의 모든 개념들을 몇 개의 제한된 보편적 기호들의 조합으로 바꿀 수 있다고 생각하며 다음과 같이 적었다.

“일종의 보편언어나 문자는 지금까지의 모든 언어와 무한히 다를 것이다. 왜냐하면 보편언어에서는 기호나 단어가 이성을 지도하게 되며, 사실판단을 제외하면 모든 오류란 단순히 계산상의 착오일 뿐이다. 이러한 언어 혹은 기호를 발명하거나 구성하는 것은 매우 어렵겠지만 어떤 사전도 없이 매우 쉽게 이해할 수 있게 될 것이다.”

‘보편언어’를 찾기 위한 그의 노력은 그로부터 30년 후인 1700년, 중국 청나라 강희제때 북경에 파견 나갔던 한 선교사로부터의 편지에서 해결의 실마리를 찾는다. 예수회 부베(J. Bouvet) 신부가 보내준 ‘주역의 64쾌’를 알게 되면서 ‘0과 1’이라는 가장 단순한 조합으로 환원될 수 있는 이진법 체계를 생각해 낸다.

‘라이프니츠(Leibniz)’와 ‘주역의 64쾌’

64쾌란 '주역'(周易)에서 인간과 자연의 존재와 변화 체계를 상징하는 64개의 기호수를 뜻한다. 주역은 유교의 ‘오경’인 시경, 서경, 역경, 예기, 춘추 중에서 ‘역경’을 일컫는데, 주나라 복희씨가 처음 8쾌를, 그 이후 신농씨가 64쾌를 완성했다.

다른 경전과는 달리 대부분 상징부호로 표시돼 있다. 장자 ‘천하’편에서 64쾌에 대한 언급이 있는데, 우주 삼라만상의 온갖 복잡한 변화를 음양의 대립과 조화라고 하는 아주 단순한 원리로 설명하고 있다고 적고 있다.

‘보편언어’를 찾고 있던 라이프니츠에게 이런 동양 철학 원리는 매우 매력적으로 보였을 것이다. 그는 ‘음과 양’이든 ‘여와 남’이든 혹은 ‘on-off'나 ‘0과 1’이든 서로 분명히 구분되는 대척점이 존재하고 두 세계를 대표하는 기호를 체계적으로 구성할 경우에는 10진법으로 표현됐던 모든 수를 완전히 재구성할 수 있고, 복잡한 수학적 연산도 더 쉽게 가능할 것이라는 재미있는 발상을 한 것이다.

한편 당시는 중세의 신학적 영향이 컸던 관념론적 철학과 근대 과학의 발달을 가져온 유물론적 철학 전통이 서로 대결하는 상황이었고, 라이프니츠는 서로 다른 두 패러다임을 통합하기 위해 노력하던 시기였다. 그렇기에 세상의 변화를 매우 단순하게 설명하는 동양 철학의 접근은 그의 관심을 끌게 됐는데, 라이프니츠는 후에 “내가 64쾌를 보지 못했다면 이진법을 만들어 낼 수 없었을 것”이라며 ‘0과 1’의 이진법을 만드는데 동양사상이 결정적인 영향을 미쳤음을 스스로 적기도 했다.

또한 라이프니츠는 컴퓨터 연산 처리의 가능성을 찾은 인물이기도 했다. 이진법에 대한 이론을 바탕으로 튜링 기계를 발명해 기계 연산에서 획기적인 전기를 마련하게 된다. 파스칼의 계산기에 곱셉과 나눗셈 기능을 추가하기도 했고, 최초로 대량 생산된 계산기계인 ‘라이프니츠 휠’을 직접 만들기도 했다. 놀라운 사실은 본격적인 컴퓨터 발명 250년 전에 라이프니츠는 그가 발명한 ‘단계 계산기’에서 이미 이진법 작동원리를 실현하고 있었다는 점이다.

한 예로, 1934년 노버트 와이너(N. Weiner)는 자율통제와 조정능력을 갖춘 컴퓨터 시스템이 적용된 사이버네틱스(Cybernetics) 이론을 설명하면서, 이 이론의 핵심 구성요소인 정보의  피드백 개념은 라이프니츠의 계산기 원리로부터 영향을 받았다고 적기도 했다.

수의 개념을 기호로 표시한 ‘숫자’는 인류 문명의 발달과 그 궤를 같이 하며 진화했는데, 오늘날 모든 사람들이 사용하고 있는 아라비아 숫자는 어디서 어떻게 시작됐는지가 궁금하다.

인도-아라비아 숫자의 기원과 확산

아라비아 숫자는 1에서 9까지 그리고 0을 포함해서 10개의 기호로 이뤄진 오늘날 전 세계가 공통으로 사용하고 있는 수체계다. 10개의 기본 숫자를 이용해 어떤 수라도 표현할 수 있으며, 거의 모든 수학적 연산도 가능하다. 중세기간 동안 당시 유럽의 동방 무역을 책임졌던 아라비아 상인들에 의해 유럽에 소개되면서 아라비아 숫자로 지금까지 불리게 된다.

영국 런던대학교 컴퓨터공학 교수인 피터 벤틀리(Peter Bentley)는 ‘수의 책’(The Book of Numbers)에서 인류 문명의 발달과정과 현대인의 모든 삶의 중심에 자리하고 있는 아라비아 숫자에 대해 다음과 같이 적고 있다.

“우리는 숫자에 둘러싸여 있다. 숫자로 대화하고 숫자로 오락거리를 만들어 내기도 한다. 우리 삶을 지배하는 숫자는 우리를 아침마다 깨우고 목적지를 알려준다. 절대적인 권한을 가진 숫자는 한치의 어긋남도 없이 모든 일을 정확하게 판단한다.”

그럼 ‘아라비아 숫자’는 어떻게 시작됐는지를 알아보기 위해 우선 간단하게 인류 역사에 있어 ‘숫자’의 발전과정을 살펴보도록 하자.

나폴레옹은 이집트를 정복했을 때 나일강 하구의 로제타라는 작은 도시에서 문자와 숫자가 기록된 바위를 하나 발견한다. ‘로제타석’(Rosetta Stone)이라고 불리는 이 돌에는 고대 이집트의 문자와 숫자가 기록돼 있었는데 고대 사회에 실제 물건의 모양을 활용한 숫자가 사용되어지고 있었음을 보여준다.

그리고 기원전 3000년경 바빌로니아의 수메르인들은 쐐기모양의 기호로 된 숫자와 60진법 수체계를 사용하고 있었고, 마야나 잉카문명 그리고 고대 중국에서도 셈을 위한 다양한 숫자가 존재했었다. 또한 지금도 특정 분야에서는 여전히 사용되어지고 있는 로마 숫자는 'V, X, M'과 같은 알파벳 문자를 이용해 숫자를 표기했다.

다양한 문명의 숫자 표기법 (출처=구글이미지)

‘수’를 논할 때 가장 많이 등장하는 인물은 고대 그리스의 철학자이자 수학자인 피타고라스(Pythagoras)다. 기원전 6세기경에 세상은 근본적으로 수학적 성질을 갖는다고 믿고 '모든 것은 숫자로 통한다. 만물은 수로 되어 있고, 모든 것은 정수의 비율로 표현할 수 있으며, 숫자가 없으면 무엇 하나 이해하거나 생각할 수 없다'고 주장했다.

‘피타고라스 정리’ 이론도 사실은 그가 생존하는 시기보다 이미 1000년 전에 바빌로니아 목판기록에 남아있다고 한다. 직각 삼각형의 세 변 길이 사이의 관계를 실제로 증명한 것이 피타고라스와 그의 추종자들이었기에 이름이 붙여진 것이다.

9세기 페르시아의 수학자 알콰리즈미(M. al-Khwarizmi)는 825년 ‘인도 숫자를 사용한 계산’이라는 저서에서 아라비아 숫자를 이용한 최초의 사칙 연산(덧셈, 뺄셈, 곱셉, 나눗셈)을 만들게 된다.

현존하는 서양 최초의 아라비아 숫자는 976년 스페인에서 제작된 ‘비길라누스 코덱스(Codex Vigilanus)'에 등장한다. 그런 후, 1202년 이탈리아의 수학자인 ‘레오나르도 피보나치’(Leonardo Fibonacci)의 저서 ‘계산서(Liber Abaci)'를 통해 현재 형태의 아라비아 숫자와 이를 이용한 계산방법 등이 유럽 세계에 본격적으로 소개됐다.

특히, 15세기중반 구텐베르그의 금속 인쇄술의 발명은 그 확산에 결정적인 계기가 됐다. 아라비아 숫자가 포함된 수학과 과학 서적들이 대규모로 출판됐고, 당시에 제작된 ‘사분의’와 같은 각종 계산도구나 측정기구에서도 아라비아 숫자가 표시되기 시작했다.

유럽의 다른 국가에 비해 상대적으로 늦었던 러시아는 18세기 표트르 1세에 의해 이 십진법이 도입됐고, 중국은 원나라 때 포르투갈의 예수회 선교사들에 통해, 우리나라는 갑오개혁이후 개방화되는 과정에서 도입됐다. 1900년 이상설이 지은 ‘산술신서’에 아라비아 숫자 표기가 등장하기도 했다.

‘수의 문화사(Zahlwort und Zifffer)'를 쓴 독일 수학자 카를 메닝거(Karl Menninger)는 ‘보편언어’로서의 아라비아 숫자에 대해 다음과 같이 적고 있다.

“한 가지 사고방식이 전 세계적인 승리를 거둔 예라고 할 수 있다. 인간이 확립한 관습으로 이처럼 전 지구적인 보편성을 지닌 것은 별로 없다. 인도-아라비아 숫자는 인간이 자랑할 만큼 진정으로 보편적인 관습이 됐다.”

‘0’의 발견과 ‘위치값 기수법’

분명하게 아라비아 숫자는 과거의 어떤 기수법보다도 우월하며 혁명적이었다. 그럼 어떤 원리가 아라비아 숫자를 전 세계로 확산시킨 것인가가 궁금하다.

일반적으로 언급되는 가장 중요한 두 가지 원리는 ‘0’이라는 개념의 탄생과 수를 시각적으로 나타내는 과정에서 숫자의 위치를 달리하면서 큰 수를 표기할 수 있는 ‘위치값 기수법’(positional numeral system)의 적용이었다.

기원전 3000년경, 바빌로니아 사람들은 숫자의 표기에서 빈자리를 나타내는 기호를 이미 사용하고 있었다고 한다. 그들은 줄이 그어진 판 위에 바둑알처럼 생긴 돌을 놓아 가면서 계산을 하곤 했는데, 계산 후 결과를 기록으로 옮겨 적을 때는 문제가 생겼다.

계산판에는 칸이 나누어져 있기 때문에 빈자리가 있었지만, 옮겨 적을 때에는 간격이 들쭉날쭉해 어디가 빈자리인지 제대로 표기하기가 쉽지 않았던 것이다. 그래서 그들은 빈자리를 채울 수 있는 기호를 찾게 됐는데 그때 사용한 표시가 ‘0’이었다고 한다. 또한 고대 이집트와 중국, 마야 문명 등에서도 숫자들의 표기에 있어서 일종의 구분자 역할을 하는 기호가 있었다고 한다.

바빌로니아에서 사용되었던 인류 최초의 계산판 (출처=구글이미지)

이런 빈자리를 표시하는 ‘0’의 개념은 기원전 4세기경에 알렉산더 대왕이 인도를 침략하는 과정에서 전해지게 됐다. 고대 바빌로니아 사람들의 눈에는 셀 수 있는 형체가 없고 상상의 개념이 강하기에 ‘0’을 수라고 생각하지 못했는데, 인도인들은 아무것도 없는 상태인 무(無)이지만 실제로는 가장 중심적인 역할을 할 수 있는 숫자로서의 ‘0’의 가치를 알아보고 제대로 사용하기 시작했던 것이다

역사 기록으로 남아있는 ‘0’에 대한 최초의 언급은 7세기경 인도의 수학자인 브라마굽타(Brahmagupta)에 의해서다. 그의 천문학 저서인 ‘브라마시단테(Brahmasiddhanta)'에는 다양한 산술과 연산식 등이 포함돼 있는데, 여기서 ‘0’에 대해 언급이 여러 차례 등장한다.

그는 ‘0’의 의미를 “같은 숫자 둘을 빼면 얻어지는 숫자“로 정의했으며, 또한 0이 양수와 음수를 구분할 수 있음도 밝힌다. 그는 아무것도 남지 않은 상태, 즉 무(無)의 상태를 ‘0’이라 부르고 0이 실제 수라고 주장했다. 이를 증명하기 위해 “어떤 수에 0을 더하거나 빼도 그 수는 변하지 않으며, 하지만 0을 곱하면 어떤 수도 0이 된다”라며 0이 연산에서 어떻게 작용하는지를 매우 자세히 설명했다.

그 이후 9세기경 중세 이슬람의 가장 중요한 수학자이자 ‘대수학의 아버지’로 불리는 무하마드 알콰리즈미(M. al-Khwarizmi)의 저서 ‘완성과 균형에 의한 계산개론’에서 ‘0’의 존재는 다시 한 번 나타난다.

이 책에서 알콰리즈미는 인도 숫자의 ‘위치값 기수법’을 자세히 설명하면서 ‘0’이 어떻게 10진법의 자리수로서 기능하는지에 대해 상세히 적었다. 이 책의 제목에서 오늘날에도 사용되는 개념인 ‘알지브라(Algebra)'가, ‘알고리즘(Algorithm)'이 그의 이름으로부터 유래하기도 했다.

이후 아라비아 기수법은 11세기경에 스페인과 다른 유럽 국가로도 전해졌다. 그러나 기존의 복잡한 셈법과 또한 이런 업무에 종사하는 전문카운터(회계사)가 이미 중요한 사회적 계층으로 자리 잡고 있었던 상황이라 이 쉬운 수체계가 쉽게 받아들여지지는 않았다고 한다.

하지만 이 위치값 기수법은 상인이나 무역업자가 매매나 부기 등에 편리하고 쉽게 이용할 수 있었기 때문에 그 이후 몇백년에 걸려 천천히 유럽을 거쳐 전 세계로 확산되게 된다.

지금에는 우리가 100을 넘어가는 경우 101이라고 적지만, 이는 당시에는 0을 십의 기수에 위치시키는 것은 매우 놀라운 발상이었다. 기존의 다른 문명의 숫자들은 하나의 숫자만으로(예. 막대기) 모든 수를 표현하는 ‘단항 기수법(unary numeral system)'이나 동물이나 꽃과 같은 특정 물체에 100 혹은 1000과 같은 큰 수를 대입시키는 ‘명수법(sign-value notation)'을 주로 사용했는데 이는 큰 수를 표현하기에 매우 불편하고 복잡했다.

이런 상황에서 숫자의 위치와 계수를 이용해 수를 표현하기 시작한 아라비아 숫자가 본격적으로 사용되기 시작하면서 수학과 과학의 발달 속도는 더 빨라졌음은 분명하다.

라이프니츠에 이어 19세기 영국의 논리학자인 조지 불(George Boole)은 어떤 명제의 참과 거짓을 이진수 0과 1에 대응시켜서 명제와 명제간의 관계를 수학적으로 표현하며 기존의 논리적 공리들을 나타낼 수 있는 ‘불 대수(Boolean Algebra)'로 불리는 연산법칙과 대수 구조를 제안한다.

이런 그의 이진수 중심의 수학적 연산법은 당시 수리 논리학의 시작점이기도 했지만, 후에 컴퓨터 연산 시스템의 발달과정에서 매우 중요한 이론적 토대를 제공하게 된 것이다.

디지털 ‘0, 1’의 이진수 (출처: 픽사베이)

지금은 디지털 사회다. 또한 다양한 정보기술이 만들어 내는 빅데이터의 시대이기도 하다. 제4차 산업혁명 혹은 인공지능이니 하는 사회 변화의 핵심은 분명 디지털 기술이다. 또한 그 기술을 가능케 하는 원리의 출발은 ‘보편언어’로서의 수의 활용에서 부터다.

특히 디지털 언어 ‘0과 1’은 인간이 셈을 시작한 오래전부터 다양한 숫자의 변화과정을 거쳤고 지금은 보편언어가 된 ‘아라비아 숫자’의 영향도 받았고 그리고 결정적으로 모든 개념들은 이진법적인 코드기호로 변환될 수 있다는 라이프니츠의 발상의 전환에서 구체화됐으며, 20세기 들어 컴퓨터 연산기술의 발달로 더욱 확장돼 적용된 것이다.

관련기사

우리는 지금 그 놀라운 단순 코드를 바탕으로 구현된 문명사회에 살고 있다. 필자는 이 글을 통해 그러한 진화 과정이 오랜 인류의 노력과 함께 동서양의 사상적 만남에서 본격적으로 출발했다는 역사적 사실을 공유하는 즐거움을 느끼며 글을 마무리한다.

“모든 것에서 수를 없애 보라. 그러면 모든 것이 사라져 버릴 것이다” (성 이시도르 St. Isidore, 600년경)

*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.

김성태 고려대 미디어학부 교수

현재 고려대 ‘빅데이터 사회문제 연구센터’를 운영하며, 데이터를 통한 통찰력 있는 세상 읽기와 (빅)데이터 분석을 통한 다양한 사회 문제 솔루션 도출에 관심을 갖고 있다. 이번 '데이톨로지' 연재는 인류의 역사, 철학사상 그리고 다양한 인문학적 논쟁의 패러다임속에서 데이터 자체의 미학, 역사속의 위대한 데이터 분석가, 디지털데이터가 만드는 새로운 현상과 문화를 최근 사례와 함께 소개함으로써 미래의 성장동력으로서의 (빅)데이터의 가치를 재발견하고, 독자들에게 ‘디지톨로지Digitalogy’ ‘데이톨로지Datalogy’ ‘데이터빌리티Datability'의 중요성에 대한 토론의 장이 되기를 기대한다.