미리보는 2021 제약바이오<6>

AI신약개발 성과 창출 ‘한발 더 앞으로’

김화종
한국제약바이오협회 AI신약개발지원센터장

[의학신문·일간보사] 전 세계는 지금 팬데믹과의 전투를 벌이고 있다. 글로벌 경제 시대에 팬데믹은 파급효과가 매우 빠르고 치명적이어서 건강·경제·교육·문화 등 사회 모든 영역에서 큰 변화를 일으키며 각 국가 그리고 각 개인은 필사적으로 대응책을 고심하고 있다. 방역수칙을 잘 지키는 기본적인 대응과 함께 우리는 백신과 치료제 개발 등 “신약”의 도움을 받지 않을 수 없으며, 어느 때보다 신약개발의 중요성이 부각되고 있다. 더욱이 앞으로는 변종 바이러스 및 새로운 감염병이 얼마든지 발생할 수 있으므로 우리는 이러한 재난에 대비하는 방안도 절실히 필요하다.

신약개발은 인류의 역사만큼이나 오래된 일이고 그 방법도 다양하다. 우연한 발견, 창의적인 과학자의 노력, 수많은 실험, 임상시험을 통해서 신약이 개발되었고 이는 일부 제약사에게는 큰 수익 창출을, 사람들에게는 질병 치료의 희망을 주었다. 성공적인 신약개발 결과만 보면 드라마틱한 스토리이지만 그 과정은 결코 순탄하지 않으며 매우 큰 실패 위험 요소가 여러 개발 단계에 포함되어 있다. 최근 신약 개발의 위험요소를 줄이고 빠른 시간 내에 후보 물질을 찾기 위해서 인공지능(AI)을 신약개발에 도입하는 사례가 늘고 있다.

사람의 보는 능력(시각)은 10여 년 전까지만 해도 컴퓨터가 인간처럼 수행하기는 거의 불가능하다고 알려졌지만, 이제 AI의 시각적 인지 능력은 인간을 앞섰다. 컴퓨터가 인간의 언어를 이해하여 대응하며 몇 개의 키워드를 주면 소설을 창작하게 된 것은 불과 5년 이내에 이루어진 성과이다. 사람만 할 수 있다고 하던 일, 또는 오랜 경험의 축적이 필요하다고 생각한 일들을 AI가 대체하고 있다. 우리는 인간처럼 학습할 수 있는 컴퓨터를 만든 것이다.

2020년 11월에는 알파고를 만든 딥마인드 사에서 단백질의 3차원 구조를 매우 높은 확률로 예측하는 모델을 발표했고(DeepFold2), 이는 기존의 전통적인 과학적 방법으로 수십년간 연구한 결과를 월등하게 뛰어넘는 성과였다. 인정하고 싶지 않겠지만 이미 AI는 우리가 생각하는 것 이상의 능력을 여러 분야에서 발휘하고 있다.

신약개발에서도 여러 개발 단계에서 AI가 사용되고 있다. 약물 재창출(repositioning), 후보 물질 탐색, 약물 적응증 예측, 리드 최적화, 임상시험, 맞춤형 신약 개발, 정밀의학에 AI 기술이 적용될 수 있다.

한국제약바이오협회 A I신약개발지원센터(이하 AI센터)에서는 국민의 건강증진 뿐 아니라, 제약바이오산업이 우리나라의 차세대 전략 산업으로 자리잡을 수 있도록 하기 위해서 다음과 같이 협력, 교육 , 가속화 , 데이터(LEAD: Linker, Education, Accelerator, Data Agent) 등 네 개의 사업을 중점적으로 추진할 계획이다.

협력(Linker) 영역은 제약바이오기업, 병원, 국가기관, IT기업, 연구자들이 협력할 수 있는 네트워크를 형성하는 것을 목표로 한다. 네트워킹은 구체적으로, 교육을 통한 인적 네트워킹, 기술 협력(컨설팅) 네트워킹, 데이터 공유 및 활용을 통한 네트워킹 등 세 가지 세부 영역으로 나누어 추진한다.

교육(Education) 영역은 신약개발에 AI를 도입하는 역량을 각 기업, 연구소, 개발자 들이 확보할 수 있는 교육을 제공한다. 모든 사업의 성패에는 결국 사람이 핵심 역할을 하지만 소프트웨어로 구현되는 AI에서는 특히 AI의 동작원리를 이해하고 활용하는 능력을 갖춘 인재가 중요한 역할을 한다. 고도의 프로그래밍 기술을 익히지 못하더라도 관계자 간의 의사소통을 위해서는 기본 개념을 서로 명확히 이해해야 한다. AI센터에서는 2020년 교육에 대한 피드백을 반영하여 2021년에는 더욱 효과적인 교육프로그램을 운영할 계획이다.

가속화(Accelerator) 영역은 신약개발 가속화를 위해서 각 기관과 기업이 어떤 AI 기술을 어떻게 적용하는 지를 다룬다. 가속화는 구체적으로 AI를 구현하는 소프트웨어를 통해서 이루어진다. 파이썬, 텐서플로우를 비롯하여 최신의 논문에 사용된 소프트웨어는 깃허브(github) 등 을 통해서 즉시 공개되는 시대이다. 그러나 기본적인 프로그램 소스 코드가 공개되더라도 이를 수정하여 최적화하는 실용화 능력이 필요하다. AI센터에서는 신약개발에 필요한 핵심 AI 기술과 이의 활용 솔루션을 개발 공급한다. 이를 위해서 협력, 교육을 통해 확보된 네트워크를 활용하고 관련 데이터와 솔루션을 탑재한 클라우드 기반 AI 신약개발 프레임워크 인프라를 이용해 기술수요기관, 기업, 연구소 등을 연결하여 연구과제화, 컨설팅, 기술전수 사업을 추진한다.

데이터(Data Agent) 영역은 관련 기관 및 기업이 보유한 데이터를 실제적으로 공개, 공유, 활용하기 위한 사업을 추진한다. 그러나 보건의료 빅데이터는 대표적인 민감 데이터이며 현재로서는 효과적인 공유 방안이 불분명하다.

데이터 공유를 법제도와 정책 또는 포맷 표준화 등으로만 해결하기에는 한계가 있다. 데이터 공개에 대한 책임소재 문제, 데이터 품질관리 문제, 실시간 활용 등의 측면에서 한계가 있기 때문이다. AI센터에서는 이러한 문제를 해결하기 위한 솔루션의 하나로 연합학습(federated learning)을 사용하여 원시(raw) 데이터의 공유를 원천적으로 피하면서 머신러닝 학습 효과를 높이는 방안을 개발 중이다.

AI의 능력과 활용 가능성은 이미 여러 영역에서 입증되었고 선진국들은 신약개발, 진단, 치료, 예방 그리고 정밀의료를 위해서 AI 도입을 확대하고 있다. AI 센터의 비전은 LEAD 사업을 통해서 국내 제약사와 의료기관들이 신약개발에 AI를 적극 활용하여 새로운 산업혁신기반을 마련하고 국민 삶의 질을 향상시키는 생태계를 만드는 것이다. 올해는 우리나라가 코로나 극복과 함께 신약개발의 선진국으로 도약하는 한해가 되기를 희망한다.

저작권자 © 의학신문 무단전재 및 재배포 금지