인기 키워드 순위

    메디게이트 뉴스

    의사들의 인공지능 활용 경험, 진단에 도움되지만 임상적 유용성은 아직…

    연세대의료원 CCIDS 심포지엄, 민감도·특이도 향상 이상의 코호트 연구 필요

    기사입력시간 2019-07-22 11:11
    최종업데이트 2019-07-22 15:24

    사진=게티이미지뱅크 

    [메디게이트뉴스 이영민 인턴기자 한림의대 본4] 2016년 알파고 사건 이후 의사들은 인공지능(AI)을 직접 활용하고 경험해보면서 어떻게 느끼고 있을까. 의사들은 인공지능을 통한 진단에서 일부 도움되지만 임상적 유용성에 대해서는 보다 많은 연구가 필요하다고 밝혔다.  

    19일 연세암병원 서암강당에서 연세대의료원 의료영상데이터사이언스센터(CCIDS)이 주최한 미래 임상 데이터 과학(Clinical Imaging Data Science)에 대한 심포지엄이 열렸다. 이날 심포지엄은 세 개의 세션으로 진행됐으며 최근 대두되고 있는 인공지능(AI)의 임상적인 이용에 대해 설명하는 시간을 가졌다.

    이날 세번째 세션에선 'Beyond performance'란 주제로 영상의학과와 AI의 관계에 초점을 맞춰 유방암과 압박 골절,흉부 영상진단과 Sustainable Developmental Goals(SDG) 등에 대해 AI의 임상적인 적용에 대한 강의가 열렸다.

    첫 번째로 발표를 맡은 김은경 연세의대 영상의학과 교수는 유방암 진단의 인공지능 도입에 대한 강연에서 “과거엔 기술력은 있는데 임상적인 협업에 있어서의 교점이 부족했다. 루닛(Lunit)이란 회사와 공동연구를 하는 중에 마침 2016년 알파고 사건으로 AI에 대한 관심이 높아져서 북미영상의학회(RSNA)에 관련 연구에 대한 초록을 냈다. 그리고 관련 진단 도구(CAD)에 대한 식품의약품안전처에 임상시험을 올해 시작했고 8월쯤엔 허가를 받을 것으로 예상하고 있다”라고 밝혔다.

    김 교수는 “AI가 유방암을 정상으로부터 구분하는 걸 1차 연구 목표로 두고 연구했고 3달만에 3만여개의 데이터를 모았다. 결론적으로 아주 만족스럽진 못했지만 AI를 트레이닝하면 정상과 유방암을 구분할 수 있다는 확신을 가지게 됐다"고 소개했다.

    김 교수는 "2차연구에서는 다양한 양성 소견을 첨가해 여러 병원의 데이터를 모아 8만 7000개의 데이터에 대한 알고리즘을 만들었다. 그랬더니 AI의 진단력이 더 정확해졌고 민감도와 정확도도 상승한 결과를 얻었다"라며 "치밀한 유방의 경우 진단이 어려운데 AI의 경우 이러한 경우에도 민감도가 높게 나타났다”라고 했다.

    김 교수는 “나아가 외국 데이터도 10%정도 포함해 튜닝해 이번에 AI-CAD제품이 나오게 됐다. 민감도가 90%정도로 예상하고 있다. 이것이 실제 임상에서 진단에 도움이 되었는지를 파악하기 위해 320개의 스크리닝 유방암영상을 얻어 14명의 판독사들을 가지고 AI based CAD 이전과 이후의 진단도가 올라갔는지를 파악하기 위한 다기관 연구를 진행했다. 그랬더니 진단도가 증가한 것으로 나타났다"고 밝혔다.

    김 교수는 "이 결과는 최근의 연구에 의해 기존 의사들의 업무량을 줄이고 진단의 정확성을 높일 수 있을 것이라는 점을 보여주고 있다”라면서“미래에는 양쪽 유방의 가장 높은 암 스코어를 PACS에 구현할 수 있는 시스템이 개발될 것으로 기대한다. 연구자들이 이러한 AI 기술이 잘 개발되는 방향으로 나가는지 끊임없이 연구해야 한다”고 말했다.

    두 번째 발표를 맡은 이영한 연세의대 영상의학과 교수는 압박 골절의 인공지능 소프트웨어 도입에 대한 강연에서 “원래 압박 골절은 복잡한 알고리즘을 통해 이뤄진다. 뼈 말단의 위축과 뼈의 높이를 통해 예측하고 외상의 유무에 따라 진단명이 나뉜다. 보통 이를 명확히 진단하기 어려운 경우가 많은데, 한 예로 노화에 따른 골절이랑 압박 골절이랑 혼동될 위험성을 들 수 있다"라며 "이에 따라 엑스레이영상으로 분류하고 골절인지 아닌지 판단하는 것이 중요하다”라고 말했다.

    이 교수는 “압박 골절의 진단에 있어서는 VCF라는 모델이 기존 여러 교수들과의 연구를 통해 개발됐던 상태다. 구체적으론 5개의 레벨에 대해 프로그램이 진단하고 압박 골절인지 아닌지 컴퓨터가 측정해 빨간색으로 표시되는 방법으로 이뤄졌다. 이를 실제 임상의학에 들여오면 어떻게 될 것인지에 대한 의문으로 연구를 시작했다”라고 밝혔다.

    이 교수는 이어 “실제 결과는 민감도 93%, 특이도는 98%가 나왔다. AI의 경우 특히 무작위 임상실험와 데이터와 현실 데이터들을 모두 활용할 수 있을 것으로 기대된다. 연구 결과 임상적으로 유용하다는 결과를 얻었지만 같은 결과를 보고도 영상에 대한 지식이 없는 사람이 보게 되면 잘못된 판단을 낼 수 있다. 이에 식약처 허가에 따라 기계를 이용할 수 있게 해야 한다고 생각한다"고 제언했다.

    이 교수는 "이런 승인을 받기 위해서는소프트웨어에 대해 통계학자와 의학물리학자가 참여해 의사가 생각하지 못하는 부분에 대해 보완하는 작업이 꼭 필요하다. 마지막으로 연구결과와 현실은 달라 민감도가 낮아지는 부분에 대해서도 주의해야 한다”라고 말했다.

    세 번째 발표를 맡은 황의진 서울의대 영상의학과 교수는 흉부영상진단의 데이터 분석 강연에서 “Chest X-ray라고 불리는 흉부영상은 기존부터 임상적 역할이 높고 수요가 많았다. 또한 데이터 수집과임상적 적용이 비교적 쉬운 장점이 있다. 다만 한장의 영상에서 봐야할 장기와 양상이 다양하고 검사 자체도 모호해서 병변이 있는지 정확하게 이야기하기 힘든경우가 많다"고 지적했다.

    황 교수는 "사진 한장으로 환자 치료에 미치는 영향도 적은 편이다. 이러한 흉부영상의 장단점을 가지고 인공지능으로 할것을 생각해 봤다. 병변을 찾거나 질병을 분류해 주는 것을 가장 먼저 할수 있는 것이라 생각해 연구를 시작했다”고 밝혔다.

    황 교수는 “엑스레이에서 보일수 있는 질환은 수도 없이 많은데 어떤 걸 집중적으로 학습시킬지 고민했다. 흔하면서도 임상적으로 중요하고 적절한 치료가 필요한 질환을 뽑아서 크게 폐암, 폐결핵, 폐렴, 기흉 등 네 개의 질환에 대한 진단 모델을 만드는것으로 방향을 잡았다. 약 9만장의 영상으로 모아 데이터를 분석했고 루닛이라는 회사와 공동으로 세 가지 모델을 만들었다"고 말했다.

    황 교수는 "이에 대한 검증을 위해 인간 판독자와 비교를 하는 옵서버 테스트를 진행해다. 연구 결과 일반 의사들보다 인공지능의 진단 확률이높았고 AI를 의사가 같이 이용했을 때 의사의 진단률이 올라가는 것을 확인할 수 있었다”라고 밝혔다.

    황 교수는 “하지만 AI 기술을 임상에서 이용되는 것에는 주의가 필요하다. AI 진단의 경우 광역적인 것보단 특정 상황에 적용시켜서 쓰는 것이 더 도움이 될 수 있다. 실제 임상 상황에서는 다양한 타깃의 질환군이 있기 때문"이라고 했다.

    황 교수는 "낮은 유병률을 가진 질환에 대해 AI를 사용할 상황에 대해 산정하고 실제 임상 데이터를 이용해 적절한 이용이 필요하다. 이를 위해선 임상 상황을 반영한 시나리오를 통해 철저한 검증이 필요하다. 또한 임상과 PACS system과의 연결도 필요하다"고 했다. 

    황 교수는 "마지막으로 AI가아직까지 임상에 크게 미치는 정도는 아니다. 판독이 없는 상태에서 진료시 도움을 줄 수 있는 정도다. 영상의학의사는 가끔 놓칠 수 있는 결절 발견에 도움은 되지만, 추가 영상으로 인한 판독의 불편함을 보이고 있다. 결국 AI가 민감도와 특이도라는 지표 이상의 가치를 보여주기는 어렵기 때문에 코호트 연구 등을 통해 환자의 예후를 평가하는 데 더 유용하게 작용하는 방향으로 개발돼야 한다"고 말했다.

    마지막으로 강연을 맡은 윤상철 연세의대 안과 교수는 SDG의 AI 도입 강연에서 “WHO는 모든 사람에게 2030년까지 필수적인 의료를 받지 못하는 사람이 없도록 하겠다고 한다. 하지만 이미 배출된 의사들의 역량에 대한 의문과 각국 주요 의료인력의 탈지방화 현실이 닥치면서 이를 해결하기 위해 방안을 찾아야 했다"고 말했다.

    윤 교수는 "이 와중에 필수적인 의료에 대한 대중들의 인식이 올라가고 스마트폰의 보급률도 올라가 전세계의 75%가 이용하고 있다. 아울러 의료비 차원에서 WHO가 실질적으로 투여할 수 있는 예산은 전체 필요한 예산의 33%정도였다"라며 "이런 현실적 난제 앞에 나타난 것이 AI였고, 2018년 세계보건총회(WHA)에서 디지털 헬스를 도입하겠다고 말하고 외교문서로 디지털헬스를 가장 먼저 두게 됐다”라고 회고했다.

    윤 교수는 “하지만 AI의 의료적 이용에 대한 증거가 부족하기 때문에 AI를 연구하는 의료진에게 이 증거를 채우고 있기를 바란다. 이를 통해 기술의 도움으로 현실의 어려움을 넘어갈수 있는 하나의 촉매제 역할을 기대하고 있다"라고 했다.

    윤 교수는 "여러가지 의료의 질 문제에 있어서는 AI의 도움을 원하고 있다”라면서 ”미국의 원조기구(USAID) 는 'AI in global health'라는 항목을 만들어넣고 새 시대에 대한 전망을 내다보고 있다. 이를 통해 원조의 효과를 내다보는 신기술도 도입하는 단계"라고 했다.

    윤 교수는 "이에 대한 데이터는 어떻게 관리하고 현지에서 오류없이 적용될 수 있을지에 대한 고민을 갖고 있다. 글로벌 헬스 안에서 이러한 AI에 대한 조정자 역할이 필요하다”고 주문했다.