김화종 원장, “제약바이오 분야 데이터 안전한 공유 플랫폼 확보”

[의학신문·일간보사=김정일 기자] 국내 AI 기반 신약개발을 가속화하기 위한 ‘K-MELLODDY’ 사업이 본격화된다.

한국제약바이오협회 AI신약융합연구원 김화종 원장<사진>은 최근 제약바이오협회 ‘KPBMA FOCUS’에 기고한 ‘연합학습 기반 신약개발 플랫폼 FDD’를 통해 “FDD의 최종 목표는 신약개발을 위한 AI 모델 학습에 필요한 데이터를 기관 간에 안전하게 공유할 수 있는 플랫폼을 확보하는 것”이라고 밝혔다.

한국제약바이오협회 AI신약융합연구원은 지난 3월 11일 ‘연합학습 기반 신약개발(FDD, Federated Learning based Drug Discovery) 가속화 프로젝트’ 사업에 최종 선정돼 4월부터 세부 과제 기획, 공모·선정 등 본격적으로 추진할 예정이다.

FDD 플랫폼 사업은 2019~2022년 수행된 EU의 MELLODDY(Machine Learning Ledger for Drug DiscoverY) 사업을 모델로 기획됐다. EU MELLODDY 사업에는 암젠, 아스텔라스, 아스트라제네카, 바이엘, 얀센, 머크, 노바티스 등 10개 제약 회사와 5개 IT 회사, 2개 대학이 참여해 각 제약사의 실험 데이터를 연합학습을 이용해 안전하게 공유하는 것을 실증한 사업이다.

FDD 플랫폼 사업을 통해 신약개발 과정에서 유용하게 사용할 수 있는 연합학습 플랫폼 기반 약물 흡수, 분포, 대사, 배설, 독성(ADMET; Absorption, Distribution, Metabolism, Excretion, Toxicity) 예측 솔루션을 만들 것이며 이 예측 솔루션을 ‘FLAP(Federated Learning based ADMET Predictor)’이라고 명명했다.

김화종 원장은 “제약바이오 분야의 데이터는 이미지나 텍스트 같은 방대한 공개 데이터와 달리, 실험으로 확보할 수 있는 학습데이터 수가 적고, 특히 다른 기관에서 생산한 데이터를 공동 활용하기가 어렵다”며 “AI 기반의 신약개발 모델이 성공하기 위해서는 충분한 학습데이터가 확보돼야 한다”고 강조했다.

김 원장은 “신약 후보 물질의 첫 검증 과정인 in-vitro 실험을 통해 후보물질의 ADMET 값을 측정하고 있으나, 이 결과만으로 in-vivo 및 임상시험 통과를 보장하지 못하는 경우가 많으며 이는 in-vitro 실험 방식의 한계”라며 “신약개발 가속화 연구보고서에 의하면 북미·유럽의 신약개발 R&D 비용 중 22%를 ADMET 검증이 차지하고 있으며 ADMET는 임상시험의 성공률을 결정짓는 가장 중요한 요소”라고 전했다.

김화종 원장은 “FDD 사업에서 가장 중요한 목표는 연합학습의 실제 현장 적용을 확인하고 향후 확대 가능성을 입증하는 것”이라며 “1차년도에는 세부 사업별 구체적인 목표 설정과 연구개발 범위를 상세하게 설계하고, 2차년도 이후에는 FDD 플랫폼을 구축하고 FLAP 동작을 확인하며 이의 고도화 및 확산을 추진할 것”이라고 밝혔다.

김 원장은 “연합학습 실제 도입 시 가장 큰 이슈는 자신이 보유한 모델 성능도 개선되겠지만 공동의 모델 성능개선을 위해서 자신의 데이터를 활용하는 것에 대한 거부감”이라며 “이러한 문제를 피하기 위해서는 데이터 소유자에게 인센티브를 제공해야 하며, 예를 들어 활용된 데이터의 양과 질에 기반한 'AI 모델 개선 기여도'를 측정하고 이를 향후 정부 지원 사업이나 우수 AI 회사 발굴에 활용하는 전략이 필요하다”고 설명했다.

또한 “데이터의 다양성 확보를 위해 제약사가 약물 후보물질 발견 단계에서 수행한 in-vitro 데이터뿐 아니라, in-vivo, 임상 진행 중 측정된 약동학 데이터 보유기관과의 협력 전략이 필요하다”고 덧붙였다.

김화종 원장은 “FDD 사업을 통해 현장에서 유용하게 사용할 수 있는 우수한 성능을 가진 ADMET 예측 모델을 개발하고 참여기관을 확대할 것”이라며 “이 사업을 통해 구축되는 플랫폼은 향후 신약개발 과정에서 타깃 발굴, 후보물질 탐색, 선도물질 최적화, 임상 설계, 시판 후 조사 등 여러 단계에 적용될 수 있을 것”이라고 말했다.

김 원장은 “글로벌 협력을 통해 FDD 참여자를 확대하고 플랫폼의 성능을 높일 것”이라며 “성능이 개선된 ADMET 예측 모델 개발을 통해 시험 분석 비용을 절감할 수 있을 것”이라고 언급했다.

2022년 국내 상장 제약사의 민간 신약개발 R&D 투자 비용은 4조 3894억원이며, R&D 비용 중 ADMET 시험 분석에 약 9656억원이 소요(북미·유럽 비율 22% 적용 시)된 것으로 추정됐다. 여기에 개선된 모델을 통해 20%의 비용을 절감하는 경우, 2022년 기준 R&D 비용 연간 1900억원 이상 절감이 예상됐다.

김화영 원장은 “FDD 사업을 통해 연합학습 기술이 현업 문제 해결에 적용되는 국내 최초의 성공 사례를 만들 것”이라며 “구체적으로는 최고의 성능을 얻는 네트워크 기반의 ADMET 예측 솔루션, FLAP을 구축할 것”이라고 밝혔다.

저작권자 © 의학신문 무단전재 및 재배포 금지