연세대 의과대학 용인세브란스병원 피부과 김제민‧김지희 교수, 세브란스병원 피부과 이주희 교수 연구팀은 최근 딥러닝 기반의 이미지 분석을 이용한 수술 후 흉터 중증도 예측 모델을 개발했다고 15일 밝혔다.
흉터의 정도를 판단하는 데에 여러 기준이 있음에도 실제 의료 현장에서는 전문가의 경험과 판단에 의존하는 경향이 크다. 하지만 전문가마다 판단이 일관되지 않을 수 있어 정확한 평가를 위해서는 객관적이고 표준화된 방법이 필요하다. 중증도, 병변의 경과, 치료에 대한 반응 등을 예측할 수 있다면 치료가 필요한 환자를 조기 선별하고 맞춤형 치료를 제공하는 데 도움이 될 것으로 기대된다.
연구팀은 흉터의 중증도를 더욱 정확하게 예측할 수 있는 이미지 및 임상 데이터 기반 딥러닝 통합 모델을 제작하기 위해 연구를 수행했다. 연구에는 갑상선 절제술 후 흉터가 있어 세브란스병원 피부과 및 연세암병원 흉터성형레이저센터에 내원한 환자 1283명의 데이터를 활용했다. 흉터의 중증도는 밴쿠버 흉터 점수(VSS)와 흉터 전문 피부과 전문의 3명의 임상적 판단을 기반으로 분류했다.
연구에 활용한 데이터는 주 데이터셋(Main Dataset), 주 데이터셋과 시공간적으로 분리된 외부 테스트셋으로 분류된다. 흉터 중증도를 분류하는 인공지능 모델은 주 데이터셋에서 분할한 내부 테스트셋 및 외부 테스트셋을 통해 검증했다. 또한 16명의 피부과 의사에게 내부 테스트셋의 흉터 이미지를 제공하고 중증도를 평가한 뒤 인공지능 모델과 성능을 비교했다.
연구 결과 내부 테스트셋을 활용한 이미지 기반 모델의 수신기 작동 특성 곡선(ROC) 아래 영역은 0.931이고, 이 값을 임상 데이터와 결합했을 때는 0.938로 소폭 증가했다. 외부 테스트셋을 활용한 이미지 및 임상 데이터 결합 예측 모델의 ROC 아래 영역은 각각 0.896, 0.912였다.
또한 내부 테스트셋 이미지를 기반으로 평가한 모델의 성능은 피부과 의사 16명의 평가 결과와 비교해 유사한 결과를 나타냈다. 이는 이미지와 임상 데이터로부터 도출된 인공지능 모델이 수술 후 흉터 중증도를 효과적으로 예측할 수 있다는 것을 의미한다.
김제민 교수는 "이번 연구를 통해 개발된 인공지능 모델은 흉터 진단의 정확도를 크게 향상해 임상 환경에서 객관적이고 신뢰도 높은 의사 결정을 내리는 데 도움을 줄 것"이라며 "앞으로 환자의 치료 방법을 개선하고 더욱 예측 가능한 치료 결과를 만들 수 있길 기대한다"고 밝혔다.
연구팀은 이번 연구를 통해 수집한 고품질·대규모의 표준화된 수술 후 흉터 데이터셋 및 중증도 평가 알고리즘이 추후 다른 피부 섬유화 질환의 중증도를 평가하고 치료 반응을 예측하는 데에도 확장하여 활용할 수 있을 것으로 판단해 추가적인 모델 개발을 추진하고 있다.
이번 연구는 네이처의 자매지인 ‘사이언티픽 리포트(Scientific Reports, IF 4.6)’에 최근 게재됐다.
흉터의 정도를 판단하는 데에 여러 기준이 있음에도 실제 의료 현장에서는 전문가의 경험과 판단에 의존하는 경향이 크다. 하지만 전문가마다 판단이 일관되지 않을 수 있어 정확한 평가를 위해서는 객관적이고 표준화된 방법이 필요하다. 중증도, 병변의 경과, 치료에 대한 반응 등을 예측할 수 있다면 치료가 필요한 환자를 조기 선별하고 맞춤형 치료를 제공하는 데 도움이 될 것으로 기대된다.
연구팀은 흉터의 중증도를 더욱 정확하게 예측할 수 있는 이미지 및 임상 데이터 기반 딥러닝 통합 모델을 제작하기 위해 연구를 수행했다. 연구에는 갑상선 절제술 후 흉터가 있어 세브란스병원 피부과 및 연세암병원 흉터성형레이저센터에 내원한 환자 1283명의 데이터를 활용했다. 흉터의 중증도는 밴쿠버 흉터 점수(VSS)와 흉터 전문 피부과 전문의 3명의 임상적 판단을 기반으로 분류했다.
연구에 활용한 데이터는 주 데이터셋(Main Dataset), 주 데이터셋과 시공간적으로 분리된 외부 테스트셋으로 분류된다. 흉터 중증도를 분류하는 인공지능 모델은 주 데이터셋에서 분할한 내부 테스트셋 및 외부 테스트셋을 통해 검증했다. 또한 16명의 피부과 의사에게 내부 테스트셋의 흉터 이미지를 제공하고 중증도를 평가한 뒤 인공지능 모델과 성능을 비교했다.
연구 결과 내부 테스트셋을 활용한 이미지 기반 모델의 수신기 작동 특성 곡선(ROC) 아래 영역은 0.931이고, 이 값을 임상 데이터와 결합했을 때는 0.938로 소폭 증가했다. 외부 테스트셋을 활용한 이미지 및 임상 데이터 결합 예측 모델의 ROC 아래 영역은 각각 0.896, 0.912였다.
또한 내부 테스트셋 이미지를 기반으로 평가한 모델의 성능은 피부과 의사 16명의 평가 결과와 비교해 유사한 결과를 나타냈다. 이는 이미지와 임상 데이터로부터 도출된 인공지능 모델이 수술 후 흉터 중증도를 효과적으로 예측할 수 있다는 것을 의미한다.
김제민 교수는 "이번 연구를 통해 개발된 인공지능 모델은 흉터 진단의 정확도를 크게 향상해 임상 환경에서 객관적이고 신뢰도 높은 의사 결정을 내리는 데 도움을 줄 것"이라며 "앞으로 환자의 치료 방법을 개선하고 더욱 예측 가능한 치료 결과를 만들 수 있길 기대한다"고 밝혔다.
연구팀은 이번 연구를 통해 수집한 고품질·대규모의 표준화된 수술 후 흉터 데이터셋 및 중증도 평가 알고리즘이 추후 다른 피부 섬유화 질환의 중증도를 평가하고 치료 반응을 예측하는 데에도 확장하여 활용할 수 있을 것으로 판단해 추가적인 모델 개발을 추진하고 있다.
이번 연구는 네이처의 자매지인 ‘사이언티픽 리포트(Scientific Reports, IF 4.6)’에 최근 게재됐다.