[메디게이트뉴스 하경대 기자] 인공지능(AI) 판독을 이용한 골연령(Bone age) 측정은 뷰노(Vuno)가, 폐결절 검출은 루닛(Lunit)이 가장 효과적인 것으로 나타났다. 두곳 모두 국내 AI 영상의학 분야를 대표하는 기업이다.
네덜란드 라드바우드대학병원(Radboud University Medical Center) 등 연구팀은 '상용 AI 소프트웨어 성능 비교 연구'를 10일 미국 국제학술지 Radiology를 통해 공개했다.
연구팀은 AI 비교 연구를 위해 폐결절 검출 비교를 위해 환자 386명의 흉부 방사선촬영 사진을 두고 결절 사례를 판별하도록 했다.
연구결과, 7곳의 다국적 AI기업 중 루닛이 민감도, 특이도 측면에서 성능이 가장 우수했다. 우선 영상의학과 전문의들 즉, 사람에 의한 판독 정확도(ACU, 1에 가까울수록 정확)는 0.81이었다.
루닛의 정확도는 사람보다 높은 0.93이었으며, 애널라이즈에이아이(Annalise.ai)가 0.90, 옥시핏(Oxipit)이 0.88, 밀뷔(Milvue)가 0.86, 뷰노(Vuno) 0.84 순이었다.
사람이 판독하는 것 보다 정확도가 높지 않은 기업은 지멘스(Siemens Healthineers)와 인퍼비전(Infervison) 뿐이었다.
특히 루닛은 민감도(sensitivity) 측면에서 가장 높은 점수를 받았다. 사람에 의한 판독 민감도가 71%에 그치는 반면 루닛의 판독 민감도는 89%에 달했다. 민감도가 높을수록 영상판독 과정에서 작은 문제 소견도 정확하게 짚어질 수 있다.
또 연구팀은 골연령(Bone age) 측정을 위해선 뷰노와 비지아나(Visiana)를 일대일로 비교 분석했다.
연구결과, 뷰노의 측정 평균 오차가 0.01로 비지아나(0.07)에 비해 오차 범위가 적은 것으로 나타났다. 또한 판독 일치도를 나타내는 R값 역시 뷰노와 비지아나가 0.989대 0.987 미세하게 뷰노가 우세했다.
분당서울대병원 황성일 영상의학과 교수는 "이번 연구는 글로벌 다국적 AI 기업들과 비교해 국내 AI 판독 기술이 여러 지표에서 최고 수준임이 증명된 셈"이라고 평가했다.