질병 유전자 찾아내는 통계 알고리즘 개발

예측력 2배 이상 높인 분석법...신약 개발에 활용 기대

[의학신문·일간보사=이균성 기자] UNIST(울산과학기술원)는 생명과학부 남덕우 교수팀이 최근 질병 유전자를 정확하게 많이 발굴하는 강력한 통계 알고리즘(GSA-SNP2)을 개발했다고 26일 밝혔다.

이 알고리즘은 1만 명 이하의 적은 유전체 데이터만으로도 효과적으로 작동함으로써 질병 유전자 후보군을 발굴하는데 드는 비용과 시간을 크게 줄일 것으로 주목된다.

사람의 DNA 염기서열은 조금씩 다르게 나타난다. 이런 염기서열의 차이를 '스닙(SNP)'이라고 하는데, 대규모 유전체 데이터를 통계적으로 분석하면 특정 질병과 관련된 스닙(SNP)들을 찾을 수 있다.

하지만 현재 사용하는 통계분석 방법들은 질병 유전자가 아닌데, 질병 유전자로 판단하는 '허위양성' 결과를 엄격히 통제하도록 설계돼 있어 유의미한 스닙(SNP)을 많이 찾지 못한다.

남 교수팀은 허위양성을 잘 통제해 정확한 결과를 얻으면서도 통계적 예측력을 높이는 알고리즘 개발을 목표로 삼았다. 이를 위해 '유전자 그룹(pathway) 상관관계 분석법'을 활용하면서 유전자 스코어에 큐빅 스플라인(cubic spline) 이라는 수학적 보정을 적용했다.

유전자 그룹은 특정 기능을 수행하는 데 관여하는 유전자 집단이다. 이들은 수백에서 수천가지 그룹으로 선별돼 데이터베이스로 정리되어 있다. 이 정보를 이용하면 개별 스닙(SNP) 비교에서는 놓쳤던 의미를 새롭게 찾을 수 있다.

남 교수팀은 이 기법을 쓰면서, 이미 질병과 상관관계가 높게 나타난 스닙(SNP)들은 제외하고 유전자 스코어를 보정함으로써 통계적 예측력을 높였다.

남 교수는 "질병 유전자 후보로 강하게 판단되는 스닙(SNP)을 빼면, 임의의 유전자 분포(영 분포)를 얻게 된다"며 "이 상태에서 다시 통계적으로 유의미한 걸 찾아내도록 설계했기 때문에 기존 방법보다 2배 이상 예측력이 높아졌다"고 설명했다.

이어 "새로운 통계 알고리즘을 적용하면 다양한 질병 유전자 그룹들을 다수 발굴할 수 있을 것"이라며 "신약개발 또는 스닙(SNP)분석 관련 연구기관이나 기업에서 활용하면 질병 치료에 기여하는 유용한 도구가 될 것"이라고 덧붙였다.

이번 연구결과는 영국 옥스퍼드대학 출판사에서 발행하는 저명한 생물학 저널 'Nucleic Acids Research(IF:10.162)' 3월 19일자 온라인판에 게재됐다.

이균성 기자 gslee@bosa.co.kr

다른기사 보기

상단영역

본문영역

질병 유전자 찾아내는 통계 알고리즘 개발

예측력 2배 이상 높인 분석법...신약 개발에 활용 기대

개의 댓글

댓글 정렬

내 댓글 모음