신년수필 - 빅데이터

▲ 유형준
시인 · 수필가

한림의대 내과 교수

‘More is different(많아지면 달라진다)’

노벨물리학상 수상자인 미국의 물리학자 앤더슨(Philip Warren Anderson)이 1972년 학술지 ‘사이언스’에 발표한 논문의 제목이다. 그의 의견에 따르면 ‘하나의 집합체는 그 집합체를 구성하고 있는 하나하나의 구성요소를 관찰하는 것만으로 예측할 수 없는 복잡하고 다른 행동을 보인다.’ 쉬운 예로 물[H2O]은 물을 구성하고 있는 수소[H]와 산소[O]에서 발견할 수 없는 전연 다른 물리학적 특성을 보인다.

이러한 개념에 근거하여 ‘많은 것’에서 ‘다른 것’을 발견하여 찾아내고 만들어내려는 시도가 바로 ‘빅데이터(big data)’다. 데이터 자체만 아니라 데이터를 다루고 응용하는 기술을 아우르는 용어다. 세계 정보기술의 연구를 선도하는 IT 연구 자문회사인 가트너그룹(Gartner Group)은 여기서 일컫는 ‘big’은 수량의 많고 큼만을 가리키는 것은 아니라고 규정한다. 자료의 생성 및 처리 속도, 자료의 다양성 등이 큰 것도 포함하지만 역시 그 근본은 각각의 변수가 지닌 특성 또는 영향력일 것이다.

상상할 수 없을 정도로 빠른 정보기술의 발전은 과거엔 별로 관심을 주지 않던 데이터들을 저장하고 살펴 ‘빅데이터’에서 예전과 다른 의미와 가치를 이끌어내어 활용하자는 의도와 노력을 유도하였다. 실제로 빅데이터 활용은 정치 경제 사회 문화 과학 등 다양한 분야에서 그 의의를 발휘하고 있다. 한 연구 보고에 의하면 빅데이터를 활용하여 미국에서 의료부문은 연간 3300억 달러(미국 정부 의료 예산의 약 8%에 해당)의 직간접적인 비용을 줄일 수 있다고 한다. 특히 임상분야에서 각 의료기관의 진료 방법과 효능, 비용 등을 분석하여 보다 효과적인 진료방법을 파악하고 최상의 지침을 만들고, 공공의료 영역에선 전국의 의료 데이터를 연계하여 질병 발생 시 빠른 대응도 가능케 할 수도 있을 것으로 전망한다.

앤더슨의 개념에 기초한 빅데이터는 환원주의와 맥을 같이 한다. 모든 생명현상을 물리학적·화학적으로 설명할 수 있다는 환원주의는 어떤 복잡한 데이터 현상도 단순하게 환원시킬 수 있다고 자신한다. 한 마디로 어떤 것이든 단순화시킬 수 있다는 것이다. 이러한 환원주의의 자신감은 ‘오캠의 면도칼(Occam’s razor)’을 생각나게 한다. 그러나 무언가를 설명하는 가설의 체계는 간단할수록 마땅하다는 오캠의 면도칼을 함부로 들이대어 도려내고 잘라버리는 단순화는 무모하기 쉽다. 진정한 오캠의 면도칼은 쭉정이에 몰두하여 공연히 번민하지 말아야 할 경우에만 꺼내야 한다. 하나하나를 더 살피고 더 생각하고 난 후에 휘두르는 면도날이다. 수량의 단순 산술적 간소화가 결코 형통의 능사는 아니기 때문이다.

물론, 살면서 단편적 정보에 매달려 비분강개하다가 전말을 접하고 나서 부끄러움에 시달리는 경우가 적지 않다. 한 가지 얻어 들은 바보가 마치 천하를 깨우친 것처럼 세상만사를 알량한 지식으로 때와 경우를 가리지 않고 함부로 판단하고 재단하려는 ‘치자일각(癡者一覺)’에 대한 탄탄한 대응이 반드시 필요하다. 단편 지식이 저지르는 개인적·사회적 폐해, 개인적·사회적 건강상의 손실을 경계하여야 한다.

진료실에서 만나는 사람은 질병을 가진 또는 예방 차원에서 질병에 대해 관심을 가진 사람이다. 그러나 마주 대하고 있는 사람이 질병만 지니거나 질병에만 몰두하는 것은 아니다. 병식(病識)을 비롯한 개인 사정, 가정사, 직장, 신앙 등의 온갖 세파(世波)를 짊어지고 마주 하고 있는 것이다. 환자 또는 관심자가 있는 것이지 질병만 덩그러니 놓여 있는 것이 아니다. 사람은 제각기 개성과 특성을 지니고 있다. 따라서 자신의 처지만을 살피고 재서 남을 이해할 수 없다. 나를 그대로 남에게 대입하여 파악할 수도 없다. 다만 자기 자신을 성찰하여 구한 것을 이해의 틀로 삼아 만남을 통하여 남을 알 수 있을 뿐이다. 검사의료, 분자의료, 유전자의료, 영상의료, 로봇의료 등을 앞세워 거두어 모은 데이터를 무조건 단순화하는 관성은 더러 멈칫할 때가 분명 있어야 한다.

쌓여가는 나이에 활기를 북돋고자 추임새를 넣을 때 ‘지금이 우리의 가장 젊은 날’이라 한다. 오늘이야말로 시간적 계량으로 가장 적고 젊은 날이니 위축되지 말고 활력을 드높이려는 덕담이다. 가장 많은 날이 쌓인 지금, 삶의 데이터가 가장 많이 쌓인 바로 지금, 개인과 사회의 희로애락 데이터 최대의 순간은 모두 같은 표현이다.

우리의 삶은 하루도 빠짐없이 데이터를 만들어 낸다. 의식주, 생로병사, 희로애락 등 본능에서 감성, 이성, 지성 그리고 영성이 닿는 모든 생각과 행동은 데이터를 낳아 쌓는다. 어제보다 오늘의 데이터가 크고 내일 더 커질 데이터를 통째로 벌려놓은 채 지낼 순 없다. 당연히 추리고 정리하여야 한다. 단, ‘오늘은 그제와 어제가 차곡차곡 쌓인 것이며, 무리 가운데 너와 나는 제각각 빛나고 있다’는 믿음으로. 어제의 그 해가 어제의 가치를 고스란히 담은 채 오늘은 새해로 떠오르고 있다. 크고 둥그런 새해가 내일을 향해 오늘의 데이터를 보태고 있다.

저작권자 © 의학신문 무단전재 및 재배포 금지