심평원, 코로나19 검사-진료 청구명세서 데이터 공개…분석시 CDM 활용 예정
연구시 심평원 데이터 기축데이터로 활용 가능성…시계열 분석 가능

[의학신문·일간보사=이재원 기자] 코로나19 임상데이터 공개 필요성에 따라 심평원이 공통데이터모델(CDM) 등을 분석 기반으로 한 임상데이터를 오픈 소스 형식으로 공개한 가운데, 향후 병원과의 CDM 연구분석 연동으로 확대될 수 있을지 관심을 모으고 있다.

심사평가원은 최근 보건복지부의 협조를 받아 코로나19의 전 세계적 확산에 효과적으로 대응하기 위해 익명화된 국내 코로나19 환자 데이터를 공개하고, 전 세계 권위있는 학계 및 정부기관과 협력 연구를 진행한다고 밝혔다.

심평원에 따르면, 원데이터는 기관 내 보유하여 개인정보 유출 없이 분석코드 시행을 통한 결과값(근거) 공유 방식으로 운영된다.

구체적으로는 코로나19 검사와 진료 청구명세서 데이터를 SAS, R과 CDM 기반의 분석툴인 Atals 프로그램을 활용해 분석한다.

여기서 공통데이터모델(Common Data Model, CDM)은 각 기관 별 상이한 데이터 용어와 구조를 표준화한 데이터 모델을 뜻한다.

서로 다른 기관에서 연구에 필요한 데이터를 표준화한 후 특정 코드만을 보내 분석하고 결과값 만을 공유하는 연구방식으로, 환자정보 등은 의료기관의 폐쇄망 안에 둔 채 연구자의 요청에 따라 요약정보만 코드로 요청자에게 전달하는 방식이다.

연구자는 환자정보를 볼 수 는 없으나 전체 환자정보 데이터를 본 것과 비슷한 연구결과를 도출 할 수 있다. 개인정보 유출 위험을 최소화한 방식이다.

실제 심평원이 주도하는 이번 코로나19 협력 연구도 참여 연구자가 분석코드를 제출하면 심사평가원이 분석코드를 수행한 후 결과(통계)값만을 제공한다.

앞서 심평원은 CDM 데이터를 활용한 PCI 환자의 항혈소판 제제 투여 효과 비교 연구 등에 청구데이터를 활용하기도 했으나 특정 질환에 청구데이터에 대해 대규모 오픈소스로 공개한 것은 실질적으로 이번이 처음이다.

이미 병원 등에서는 산업부와 아주대병원이 중심이 돼 실시한 CDM 기반 환자정보 표준화사업을 확대하고 있으며, 지난해 말 기준 전국 63개 병원이 참여 중에 있다. CDM을 활용한 코로나19 연구뿐만 아니라 향후 CDM을 기반으로 한 심평원 청구데이터-병원 청구데이터 간 연동 활용을 예상해 볼 수도 있는 상황.

심평원 빅데이터실 측은 연구 등에 있어 병원과 심평원 데이터를 상호 대조-보완하는 기축데이터로의 활용을 점쳐볼 수 있다고 전망했다.

빅데이터실 관계자는 “CDM은 기본적으로 연계를 목적으로 만들기 보다는 각 기관이 각자 청구데이터를 보유하고 그 결과를 메타분석하는 방식”이라면서 “다만 심평원이 갖는 청구데이터는 의료기관의 데이터와 중복될 수 있기에 연계라는 표현은 맞지 않다고 본다”고 밝혔다.

이 관계자는 “각각의 기관이 갖는 데이터는 임상적으로 쓰일 순 있어도 자기 병원 방문에 대해 분절된 데이터인 반면, 심평원의 데이터는 병원 전원에 대한 청구데이터를 시계열적으로 추적이 가능하다”면서 “심평원의 데이터를 기축데이터처럼 전체적인 통계로 활용하고 각 병원들이 연구한 내용을 교차확인 할 수 있게 협력적, 협조적으로 연구하는 것을 염두해 두고 있다”고 설명했다.

환자정보 표준화사업 등을 주도하고 있는 박래웅 아주대학교 의료정보학과 교수도 긍정적인 전망을 내놨다.

그는 “기술적으로는 전혀 문제가 없으며, 데이터 포맷이 같고 사용되는 용어도 같은 것을 쓰고 있다”면서 “다만 하나는 데이터를 가진 병원에서 심평원 데이터와 연결-활용하겠다는 동의를 필요로 하며, 법적으로 연결-활용이 뒷받침 되는 것이 선결돼야 한다”고 밝혔다.

저작권자 © 의학신문 무단전재 및 재배포 금지