환자 질병 유발 유전변이 발견 확률 2배 이상 향상, 해석 가능 종류 69% 증가

[의학신문·일간보사=오인규 기자] 쓰리빌리언은 최근 희귀유전질병 진단을 위한 유전변이 해석 딥러닝 모델 개발에 대한 연구 결과가 생명정보학 분야 최고의 저널 ‘Bioinformatics’에 게재 됐다고 밝혔다.

이번에 발표된 유전변이 해석 딥러닝 모델 3Cnet는 지식전이 학습이 최초로 적용된 유전변이 해석 AI 딥러닝 모델로 기존에 개발된 AI 모델들에 비해 환자 질병 유발 유전변이를 찾아낼 확률을 2배 이상 높이고, 유전 변이 중 missense 변이만 해석할 수 있던 모델들에 비해 frameshift, Indel, Stop gain/loss 등 해석 가능 유전변이 종류를 69% 증가 시킨다.

연구팀은 인간게놈에서 나올 수 있는 유전 변이는 이론적으로는 수백억개 이상으로 유전변이 해석을 위한 충분한 AI 학습 데이터를 확보하기 어려운 문제를 해결하기 위해, 가상 유전 변이 데이터를 생성해 학습 데이터 숫자를 늘리고, 인간 유전자의 진화적 보존 데이터를 학습에 활용할 수 있도록 지식전이 학습 모델을 적용해 AI 유전변이 해석 모델을 개발했다.

진화적보존 데이터 학습은 질병 상관성이 알려지지 않은 유전자에서 발견되는 유전 변이들의 해석을 가능하게 했고, 가상 유전 변이 데이터는 유전변이 병원성 예측을 더욱 정교하게 만드는 결과로 이어졌다.

이렇게 개발된 3Cnet는 글로벌 유전체 분야 최대의 회사 일루미나의 딥러닝 기반 유전변이 해석 모델 PrimateAI 대비 기존에 알려진 질병 유발 유전변이 해석 성능을 10% 이상, 희귀질환 환자 진단 변이를 찾는 진단율(Top-5기준)2.75배 능가하는 성능을 확보했다.

AI 유전변이 해석 모델 연구를 주도한 쓰리빌리언 이경열 박사는 “3Cnet는 상용화된 병원성 예측기 가운데 최고 수준의 성능을 달성했지만 이에 그치지 않고, 최신 자연어 처리 기법 적용과 유전변이의 병원성을 일으킨 원인까지 분석할 수 있는 고차원 AI 개발로 고도화 해나갈 계획이라고 밝혔다.

한편 쓰리빌리언은 이번 발표된 3Cnet를 포함한 AI 유전진단 기술을 고도화해 희귀질환환자 진단을 위한 변이 해석에 활용하고 있으며, 이러한 AI 유전변이 해석 기술의 경쟁력을 기반으로 엑솜(WES) 및 전장인간게놈(WGS) 기반의 희귀질환 진단 검사 글로벌 시장 성장을 가속화 해 나가고 있다.

저작권자 © 의학신문 무단전재 및 재배포 금지