[이정규 칼럼]‘나무’스키마, ‘넝쿨’스키마

전문가 칼럼입력 :2020/03/20 10:31

이정규 비즈니스 IT 칼럼니스트
이정규 비즈니스 IT 칼럼니스트

파리 몽마르트 언덕을 거닌 적이 있었다. 불쑥 다가온 웬 화가는 손사래 치는 나의 얼굴을 삐쩍 마른 손으로 재빨리 그리기 시작했다. 그러곤 몇 분만에 데생 도화지를 내 눈에 들이댄다. “가난한 화가 같은데, 웬만하면 사줘야지!”하는 생각으로 척 본 인물화가 나 같지 않았다. 전혀 닮지 않았다고 퉁명스럽게 말하니 화가의 말이 걸작이다. “난 사진사가 아니오! 예술가적 비전으로 그렸다고요!” 기막힌 답변에 탄복하여 구매한 그림은 다시 보아도 정말 안 닮았다.

예술가들이야 현상의 독창적 과장과 왜곡이 차별적 가치가 될 수도 있겠지만, 개념에 대한 학자들의 과장된 정의와 왜곡은 가치보다는 문제에 가깝다. 품질관리(quality control)와 품질경영(quality management)의 사례가 그렇다. 먼저 나온 영 단어 control 에 ‘관리’를 붙여 버렸으니, 그 다음에 등장한 management를 ‘경영’이라 부를 수 밖에 없었다. 경영이 매니지먼트보다는 추상화레벨이 더욱 높은 개념임에도 말이다.

이러한 용어의 과장된 번역과 왜곡은 정보기술에서도 마찬가지이다. 계층형데이터베이스(hierarchical database)는 1:N의 다단계 트리 구조로 하나의 루트를 가진 DB 구조를 가졌다. 그러나 N:M의 인덱스를 지원하는 또 다른 데이터베이스구조가 발명되었다. 한 데이터 속성이 여러 곳을 인덱싱 하는 DB스키마의 모양새가 마치 얽힌 그물과 같아서인지 찰스 바크만(Charles Bachman)은 이를 네트워크데이터베이스(network database)라 호칭했다. 지금 생각하면 너무 성급하게 붙인 이름이라는 생각이 든다. 네트워크데이터베이스의 옳은 명칭은 ‘cross index DB’ 정도가 적당하지 않을까?

네트워크데이터베이스는 관계형데이터베이스(relational database)가 나오면서 업계에서 주도권을 잃었지만, 관계형데이터베이스 역시 용어의 과장이라는 비난을 피해갈 수는 없다. 복수의 테이블을 만들고, 테이블 사이에 공유된 인덱스를 통해서 데이터를 Join 추출하는 기능에 ‘관계’라는 포괄적 개념을 부여한 것 역시 너무 과장되기 때문이다. 관계형데이터베이스의 적정한 명칭으로 ‘indexed tabular DB(인덱스 테이블 DB)’정도가 적당하다는 생각에 동의할 전문가들은 많이 있다.

인덱스 정형 테이블 간의 연계를 SQL로 추출하는 개념이 아니라, 비정형 속성 및 활동(관계)의 저장/검색까지 지원하는 새로운 데이터베이스의 개념이 나오자, 일단의 전문가들은 새로운 데이트베이스의 이름으로 ‘정(SQL)에 반(No)’하는 변증법처럼 NoSQL이라는 이름을 붙였다. 적어도 이들은 새로운 DB 개념을 섣불리 과장하지 않은 양심은 있어 보인다. 이러한 NoSQL DB유형 중의 하나가 그래프데이터베이스(graph database)이다.

그래프하면 막대그래프, 선그래프 밖에 머리에 떠오르지 않는데 일반인들에게는 용어가 낯설 수밖에 없다. 그래프는 이산수학의 하나로서 행렬계산이 가능한 점(node, vertex)과 선(link, edge)으로 이루어진 시각적 네트워크 분석모델이기 때문이다. 대개 점은 주체를, 선은 행위(혹은 관계강도)로 간주된다. 선이 연결되면 1, 연결되지 않았으면 0으로 행렬을 계산한다. 숫자를 키우면 관계의 강도를 계산할 수도 있다. 그래프데이터베이스는 어찌 보면 관계(relationship)의 개념을 본격적으로 지원하는 데이터베이스 모델임에도 먼저 태어난 ‘인덱스 테이블 DB’에게 ‘관계형데이터베이스’의 명칭을 완전히 빼앗겨 버렸다고 볼 수 있다.

서양과학사에서 이러한 지식체계의 과장과 왜곡 문제를 해결하려 노력한 학자들은 많다. 대표적인 인물이 바로 4세기 중반 활동한 신플라톤 철학자 포르피리오스(Porphyrius)이다. 그는 아리스토텔레스의 범주론(Categories)을 계승하여 시각화된 트리형 분류모델인 ‘포르피리오스의 나무(Porphyrian tree)’를 최초로 고안했다고 알려져 있다. 그의 나무형 분류법은 서양에서 천년 이상 거부감 없이 받아 들여진 지식체계 모형이며 생물 분류체계의 모델이기도 하니, 계층형데이터베이스의 모형이 전형적인 트리구조를 따르는 것도 결코 우연은 아니다.

그러나 나무의 가지치기처럼 모든 개념에는 근원이 존재하며, 그로부터 진보된 개념이 세분화한 것으로 간주하는 수직 계층형 지식체계는 근래에 들어 학자들의 도전을 받기 시작하고 있다. 그 이유는 세상 사물이 서로 갈라지고 분화되어 경쟁하는 독립된 존재가 아니라, 작게는 몸 속 박테리아부터 넓게는 은하계처럼 우주 만물은 네트워크 그물처럼 연결되어 있고 서로 영향을 주고 받는다는 관계철학의 사상이 널리 전파되어 공감을 얻었기 때문이다.

관련기사

전통적인 트리형 지식체계는 계층적이고 상호 배타적인 분화를 가정하지만, 네트워크 지식체계는 뇌세포처럼 창발적 지식형성과 네트워킹으로 지식이 확장한다고 상정한다. 한편 네트워크라는 용어는 관계성을 내포하지만 살아있다는 어감은 느껴지지 않는다. 그 때문인지 포르피리오스가 ‘나무’라는 메타포로서 계층적 지식체계의 성장과 진화를 설명했었다면, 관계철학자 들뢰즈(Gilles Deleuze)는 새로운 네트워크적 지식체계를 땅속의 넝쿨모양 뿌리줄기(rhizome)로 비유했다. 그래프는 네트워크를 묘사하는 수학 도메인의 용어이다. 오해하기 쉬운 그래프DB라는 말 보다 차라리 ‘넝쿨DB’가 보다 직관적인 용어가 아닐까 웃으며 생각을 해본다.

어떤 업체의 메시지에서 바이러스의 전파예측과 방역를 위해서 그래프DB 모델을 사용한다는 스토리를 보았다. ‘Massive Change’의 저자 브루스 마우(Bruce Mau)는 모든 것이 다른 모든 것과 연결되었을 때, 좋은 쪽이든 나쁜 쪽이든 하나 하나가 모두 중요하다고 말했다. 분별없이 단체모임을 강행하여 이곳 저곳으로 바이러스를 전파했다는 소식을 들을 때마다 네트워크 사회에서 그 말의 무게를 절감한다. 코로나 바이러스의 확산방지와 예방 노력이 질병관리본부 만의 일이 아니라 우리 개개인의 책임감과 헌신이 중요한 이유이다. 현대는 얽히고 설킨 넝쿨사회이기 때문이다.

*본 칼럼 내용은 본지 편집방향과 다를 수 있습니다.

이정규 비즈니스 IT컬럼니스트

(현)사이냅소프트 경영혁신담당 중역. 경영정보학 박사, 정보관리기술사, 미국회계사. IBM, A보안솔루션회사 및 보안관제회사, 기술창업 스타트업, H그룹 계열사, 비영리 D재단, 감리법인 등에서 제조산업전문가, 영업대표, 사업부장, 영업본부장 및 컨설팅사업부장, 대표이사, 기술연구소장, 사무국장, 수석감리원을 역임했다. KAIST 기술경영대학원에서 겸임교수로 '벤처창업의 이론과 실제'를 가르쳤고, 국민대 겸임교수로 '비즈니스 프로세스'와 'IT컨설팅'을 출강하고 있다. 저서로는 '동시병행설계', '딥스마트', '비즈니스 프로세스', '프로세스 거버넌스', '실전IT컨설팅' 등이 있다. 프로보노 홈피 deepsmart.org.