[메디게이트뉴스 박도영 기자] 머신러닝(machine learning) 기술과 유전체 데이터를 결합하면 복부대동맥류(AAA) 위험을 예측할 수 있다는 연구결과가 나왔다. 복부대동맥류는 가장 빈번하게 나타나는 치명적인 심장질환 가운데 하나로, 환자가 사망한 후에야 가장 많이 진단된다.
17일 관련업계에 따르면 미국 스탠포드의대(Stanford University School of Medicine) 유전체 및 정밀의학센터 마이클 스나이더(Michael Snyder) 교수팀은 최근 국제 학술지인 셀(Cell)에 전자의무기록(EHR) 데이터와 머신러닝, 전장유전체분석(WGS) 데이터를 이용한 복부대동맥류 예측 알고리듬을 발표했다. 이 알고리듬을 이용했을 때 복부대동맥류 위험이 있는 개인을 식별하는 정확도는 70%였다.
스나이더 교수는 "유전체 분석은 암이나 미스터리한 질병을 해결하기 위해 많이 사용되고 있다. 하지만 질병 위험 예측에 사용할 수 있을지에 대해서는 아직 알 수 없는 것이 많다"고 설명했다.
이번 연구에서는 복부대동맥류 위험에 영향을 미칠 것으로 보이는 60개 유전자와 40개 기능 모듈(functional modules)을 확인하면 질병 예측이 가능한지 알아보기 위해 수행됐다.
스나이더 교수팀은 268명의 알려진 복부대동맥류 환자의 유전체 및 임상 데이터를 분석하기 위해 HEAL(Hierarchical Estimate From Agnostic Learning)이라는 머신러닝 알고리듬을 만들었다. 이 알고리듬은 어떤 유전자가 복부대동맥류 발생에 영향을 미칠지에 대한 선입견 없이 만들어졌다.
대신 이 알고리듬은 유전체 데이터에서 새로운 연관성을 확인해 면역 반응과 혈관 생성, 순환, 세포 간 커뮤니케이션 조절에 관여하는 유전적 요소를 나타냈다.
연구팀은 "연구 결과는 복부대동맥류 발생에서 임상적 요인의 중요성을 강조한 이전 연구를 확인시켜줬다. 동시에 질병에 대한 분자적 기초에 대한 지식을 확장시켰다"면서 "이번 결과는 모듈을 조절하는 치료법이 복부대동맥류 발생에 불균형적으로 영향을 미칠 것이고 향후 연구에 새로운 길을 열어줄 수 있음을 의미한다"고 설명했다.
이어 "복부대동맥류가 가역적인 질환은 아니지만 고혈압 관리나 금연 등 생활습관 변경으로 질병 진행을 중단시키고 사망 위험을 낮출 수 있다"며 "개인 유전체를 통한 예측은 이 질병의 조기 진단을 가능하게 하고, 개인 유전체 베이스라인에 기반해 조기 중재 전략 개발을 촉진할 것이다"고 전했다.
연구팀은 "머신러닝 알고리듬은 다른 고위험 질환에 대한 유전체 및 임상 데이터 분석에도 적용될 수 있다"며 "HEAL 프레임워크는 많은 복합 질환에 잠재적으로 적용 가능하며, 우리의 전반적인 접근법은 개인 유전자 염기서열을 질병 위험 예측에 통합시키는 임상 검사법 개발에 유용할 것으로 기대된다"고 말했다.