현재까지 조직병리학적 단계에 따라 예후를 예측한 연구는 많았지만 암 환자의 나이, 성별, 치료법 등 다양한 임상적 특성을 고려한 생존 예측 모델 연구는 처음이다.
강동경희대병원 이비인후과 이영찬 교수팀(이영찬, 김태훈 교수)이 머신러닝 기법을 이용해 침샘암의 생존 예측 모델을 연구해 이중 가장 높은 예측과 낮은 오차를 보인 모델을 확인했다고 19일 밝혔다. 이를 통해 향후 침샘암을 비롯한 두경부암 환자의 맞춤형 치료에 도움이 될 것으로 보인다. 연구 결과는 두경부암 유명 저널인 오럴 온콜로지(Oral oncology)에 게재됐다.
침샘암은 주타액선(침샘)과 소타액션(침샘)에서 발생하는 악성 종양을 말한다. 머리에서 가슴 윗부분까지의 영역에서 발생하는 두경부암 중 하나다. 침샘 자체가 귀밑, 혀밑, 턱밑부터 비강, 볼 점막, 구개, 혀를 비롯해 인두와 기관지까지 퍼져있어 다양한 부위에서 발생할 수 있다.
보통 초기 통증이나 증상이 없는데, 주타액선에서 발생한 경우 발생 부위에 덩어리가 생길 수 있고, 악성이 심한 경우 안면신경이나 혀가 마비되기도 한다. 저악성도의 경우 국소 수술만으로 치료가 가능하며, 고악성도인 경우에는 방사선치료까지 동반해야 한다.
현재까지 조직병리학적 단계에 따라 침샘암의 예후를 예측하는 연구는 많이 보고돼 있다. 하지만 미국암연합위원회(American Joint Committee on Cancer, AJCC)가 분류하는 암의 병기 TNM 스테이지로만 생존율을 분석한 연구방법은 개별 환자에 대한 다른 임상적 정보(나이, 성별, 치료방법 등)를 고려하지 않아 적용에 한계가 있었다.
이에 이영찬 교수팀은 미국국립암연구소에서 제공하는 암환자 빅데이터(Surveillance Epidemiology and End Result. SEER data)를 바탕으로 머신러닝(Machine learning) 기법을 이용한 생존예측모델 연구를 진행했다. 2004년부터 2016년까지 총 607명의 T3 또는 그 이상의 병기를 가진 진행성 타액선(이하선) 암환자를 대상으로 연구를 진행했다.
암환자 빅데이터(SEER data)에는 진단 시 나이, 성별, 인종은 물론 TNM stage, 조직학적 분화도, 종양의 크기, 치료 방법, 생존기간 등이 포함돼 있다.
생존분석에는 여러 모델이 있는데 이영찬 교수팀은 4가지 ▲Cox proportional hazard model (CoxPH) ▲conditional survival forest model (CSF) ▲random survival forest model (RSF) ▲DeepSurv model을 이용했다. 일차결과지표(Primary outcome)는 질병 진단일로부터 특정 질병 사망 사이의 기간을 기준으로 나타내었다.
연구결과 생존분석에서 정확도 지표를 나타내는 C-index 값에서는 각각 CSF (0.79), DeepSurv (0.79), CoxPH (0.78) 그리고 RSF (0.76) 모델 순으로 우수한 예측력을 보였다. 그리고 또 다른 비교 척도로 이용되는 Brier score(IBS) 값에서는 CoxPH (0.02), CSF (0.02) 그리고 DeepSurv (0.03) 모델 순으로 우수한 예측력을 나타냈다.
추가로 평균제곱근오차 (Root mean square error, RMSE)와 평균절대오차 (Mean absolute error)를 이용하여 잔여수명과 실제수명과의 차이를 예측했다. 여기에서는 CSF 그리고 RSF 모델에서 낮은 오차를 보이며 더 우수한 예측력을 나타냈다.
종합적으로 연구에서는 개발한 CSF모델은 가장 높은 예측 성능과 낮은 오차를 보여줬다. 비교적 드문 암에서도 머신러닝을 이용한 분석으로 기존의 예후 예측 방법보다 보다 정확한 분석이 가능할 것으로 기대됐다.
이영찬 교수는 "이번 연구를 통해 환자 개별 임상정보가 적용돼 실제적인 생존 예측을 확인할 수 있는 기틀이 마련됐다"며 "이를 통해 환자 개개인에게 맞는 맞춤형 치료 구현에 도움이 될 것으로 생각된다"고 말했다.