사전처리~특징추출 및 분류 실행 '딥인사이트법' 개발

日 연구팀 개개인 진단 및 예측에 활용 기대

[의학신문·일간보사=정우용 기자] 게놈이나 유전자정보 등 비화상데이터를 화상데이터로 변환하는 방법이 개발됐다.

게놈이나 유전자정보는 질병의 개인차 해석과 진단에 도움이 된다. 하지만 이들 정보는 수만~수천만의 변수를 가진 초고차원 데이터이기 때문에 전통적인 통계학적 방법으로는 해석이 어렵다.

일본 이화학연구소를 비롯한 연구팀은 딥러닝 등 기계학습에 주목하고, 게놈정보의 사전처리에서 특징추출 및 분류까지 실행하는 '딥인사이트법'을 개발했다. 기계학습은 많은 변수로부터 중요한 변수그룹을 추출할 수 있고 신규 샘플이 특정 질병과의 관련이 있는지 판정하는 데에도 활용할 수 있다. 하지만 방대한 게놈정보는 배후에 복잡한 구조가 있기 때문에 적절하게 변수를 배치하는 등 사전처리가 필요하다.

딥인사이트법에서는 우선 유사한 변수나 데이터가 클러스터로 변환된다. 비슷한 변수를 정리해 배치하고 다른 것은 따로 배치함에 따라 변수가 화소로 취급된다는 것.

연구팀은 딥인사이트법을 검증하기 위해 유전자발현데이터, 텍스트데이터, 모음데이터 등 다양한 데이터를 활용해 기존 인공지능방법과 결과를 비교했다. 그 결과 평균 분류정확도가 95%로 높은 것으로 확인됐다.

연구팀에 따르면 딥인사이트법에 따라 DNA배열이나 단백질 배열 등 데이터를 해석할 수 있으며 앞으로는 이 방법으로 의학·생명과학의 복잡한 데이터를 해석해 개개인의 진단 및 예측에 활용할 수 있을 전망이다.

저작권자 © 의학신문 무단전재 및 재배포 금지