파리 몽마르트 언덕을 거닌 적이 있었다. 불쑥 다가온 왠 화가는 손사래 치는 나의 얼굴을 삐쩍 마른 손으로 재빨리 그리기 시작했다. 그러곤 몇 분만에 데생 도화지를 내 눈에 들이댄다. “가난한 화가 같은데, 웬만하면 사줘야지!”하는 생각으로 척 본 인물화가 나 같지 않았다. 전혀 닮지 않았다고 퉁명스럽게 말하니 화가의 말이 걸작이다. “난 사진사가 아니오! 예술가적 비전으로 그렸다고요!” 기막힌 답변에 탄복하여 구매한 그림은 다시 보아도 정말 안 닮았다.
예술가들이야 현상의 독창적 과장과 왜곡이 차별적 가치가 될 수도 있겠지만, 개념에 대한 학자들의 과장된 정의와 왜곡은 가치보다는 문제에 가깝다. 품질관리(quality control)와 품질경영(quality management)의 사례가 그렇다. 먼저 나온 영 단어 control 에 ‘관리’를 붙여 버렸으니, 그 다음에 등장한 management를 ‘경영’이라 부를 수 밖에 없었다. 경영은 매니지먼트보다는 추상화레벨이 더욱 높은 개념임에도 말이다.
이러한 용어의 과장된 번역과 왜곡은 정보기술도 마찬가지이다. 계층형데이터베이스(hierarchical database)는 1:N의 다단계 트리 구조로 하나의 루트를 가진 DB 구조를 가졌다. 그러나 N:M의 인덱스를 지원하는 또 다른 데이터베이스구조가 발명되었다. 한 데이터 속성이 여러 곳을 인덱싱 하는 DB스키마의 모양새가 마치 얽힌 그물과 같아서인지 찰스 바크만(Charles Bachman)은 이를 네트워크데이터베이스(network database)라 호칭했다. 지금 생각하면 너무 성급하게 붙인 이름이라는 생각이 든다. 네트워크데이터베이스의 옳은 명칭은 ‘cross index DB’ 정도가 적당하지 않을까?
네트워크데이터베이스는 관계형데이터베이스(relational database)가 나오면서 업계에서 주도권을 잃었지만, 관계형데이터베이스 역시 용어의 과장이라는 비난을 피해갈 수는 없다. 복수의 테이블을 만들고, 테이블 사이에 공유된 인덱스를 통해서 데이터를 Join 추출하는 기능에 ‘관계’라는 포괄적 개념을 부여한 것 역시 너무 과장되기 때문이다. 관계형데이터베이스의 적정한 명칭으로 ‘indexed tabular DB(인덱스 테이블 DB)’정도가 적당하다는 생각에 동의할 전문가들은 많이 있다.
인덱스 정형 테이블 간의 연계를 SQL로 추출하는 개념이 아니라, 비정형 속성 및 활동(관계)의 저장/검색까지 지원하는 새로운 데이터베이스의 개념이 나오자, 일단의 전문가들은 새로운 데이트베이스의 이름으로 ‘정(SQL)에 반(No)’하는 변증법처럼 NoSQL이라는 이름을 붙였다. 적어도 이들은 새로운 DB 개념을 섣불리 과장하지 않은 양심은 있어 보인다. 이러한 NoSQL DB유형 중의 하나가 그래프데이터베이스(graph database)이다.
그래프하면 막대그래프, 선그래프 밖에 머리에 떠오르지 않는데 일반인들에게는 용어가 낯설 수밖에 없다. 그래프는 이산수학의 하나로서 행렬계산이 가능한 점(node, vertex)과 선(link, edge)으로 이루어진 비쥬얼 네트워크 분석모델이기 때문이다. 대개 점은 주체를, 선은 행위(혹은 관계강도)로 간주된다. 선이 연결되면 1, 연결되지 않았으면 0으로 행렬을 계산한다. 숫자를 키우면 관계의 강도를 계산할 수도 있다. 그래프데이터베이스는 어찌 보면 관계(relationship)의 개념을 본격적으로 지원하는 데이터베이스 모델임에도 먼저 태어난 ‘인덱스 테이블 DB’에게 ‘관계형데이터베이스’의 명칭을 완전히 빼앗겨 버렸다고 볼 수 있다.
서양과학사에서 이러한 지식체계의 과장과 왜곡 문제를 해결하려 노력한 학자들은 많다. 대표적인 인물이 바로 4세기 중반 활동한 신플라톤 철학자 포르피리오스(Porphyrius)이다. 그는 아리스토텔레스의 범주론(Categories)을 계승하여 시각화된 트리형 분류모델인 ‘포르피리오스의 나무(Porphyrian tree)’를 최초로 고안했다고 알려져 있다. 그의 나무형 분류법은 서양에서 천년 이상 거부감 없이 받아 들여진 지식체계 모형이며 생물 분류체계의 모델이기도 하니, 계층형데이터베이스의 모형이 전형적인 트리구조를 따르는 것도 결코 우연은 아니다.
그러나 개념을 나무의 가지치기처럼 분화/세분화하여 서로 겹치지 않는 범주로 인식하는 계층형 지식체계는 근래에 들어 새로운 대안을 요구하기 시작했다. 세상 사물이 서로 갈라서고 경쟁하는 존재가 아니라, 네트워크 그물처럼 연결되어 서로 영향을 주고 받는다는 관계철학의 사상이 널리 전파되어 공감을 얻었기 때문이다.
트리형 지식체계는 계층적이고 상호 배타적인 분화를 가정하지만, 네트워크 지식체계는 뇌세포처럼 창발적 지식형성과 네트워킹으로 지식이 확장한다고 상정한다. 한편 네트워크라는 용어는 관계성을 내포하지만 살아있다는 어감은 느껴지지 않는다. 그 때문인지 포르피리오스가 ‘나무’라는 메타포로서 계층적 지식체계의 성장과 진화를 설명했었다면, 관계철학자 들뢰즈(Gilles Deleuze)는 새로운 네트워크적 지식체계를 땅속 뿌리줄기인 덩굴(rhizome)로 비유했다. 그래프는 네트워크를 묘사하는 수학 도메인의 용어이다. 어려운 그래프DB라는 말 보다 차라리 덩굴DB가 직관적인 용어가 아닐까 웃으며 생각을 해본다.
솔루션 업체의 메시지에서 바이러스의 전파예측과 방역를 위해서 그래프DB 모델을 사용한다는 스토리를 보았다. ‘Massive Change’의 저자 브루스 마우(Bruce Mau)는 “모든 것이 다른 모든 것과 연결되었을 때, 좋거나 나쁘거나 모든 하나 하나가 중요하다.” 고 말했다. 분별없이 단체모임을 강행하여 이곳 저곳으로 바이러스를 전파했다는 소식을 들을 때마다 네트워크 사회에서 그 말의 무게를 절감한다. 코로나 바이러스의 전파방지와 예방 노력이 질병관리본부 만의 일이 아니라 우리 개개인의 책임감과 헌신이 중요한 이유이다. 현대는 얽히고 설킨 덩굴사회이기 때문이다.<끝>
ZDNET 칼럼 전체글 보기