[메디게이트뉴스 박민식 기자] 보건복지부를 비롯한 공공기관을 중심으로 의료데이터 개방이 확대되고 있지만 정작 현장에서 활용성은 떨어진다는 지적이 나온다.
딥노이드 김태규 전무는 5일 온라인으로 열린 대한의료정보학회 학술대회에서 “데이터 관련 규제가 지속적으로 좋아지고 있긴 하지만 여전히 풀어야 할 숙제들이 많다”며 이같이 말했다.
현재 국내 보건의료데이터는 공공기관을 중심으로 개방되고 있다. 보건복지부 및 지자체는 공공데이터포털을 통해 보건의료분야 데이터 약 2040개를 개방중이며, 국민건강보험공단과 건강보험심사평가원도 CSV와 Open API 형태로 데이터를 제공중이다.
이처럼 외부에 공개된 공공기관의 데이터들은 통계 데이터가 대부분을 차지한다. 반면, 기업들이 필요로 하는 임상 데이터는 부족하다는 것이 김 전무의 지적이다.
김 전무는 데이터뉴딜 사업의 일환으로 지난해부터 한국지능정보사회진흥원에서 진행한 인공지능 학습용 데이터 구축∙개방 사업에 대해서도 아쉬운 부분이 있다는 평가를 내렸다.
현재 해당 사업을 통해 구축 완료된 총 35종의 학습용 데이터는 ‘AI허브’를 통해 개방되고 있지만 온∙오프라인 안심존 내에서만 활용이 가능한 상황이다. 해외의 경우 TCIA(The Cancer Imaging Archive), ADNI, OASIS 등의 사이트에서 간단한 회원가입만으로 데이터 요청과 다운로드가 가능한 것과 대비되는 대목이다.
김 전무는 “데이터는 잘 구축됐지만 오프라인의 경우 폐쇄망에서만 사용이 가능하고, 온라인으로 사용하더라도 GPU 등에 제한점이 있다”며 “좋은 데이터가 있음에도 기업들이 적극적으로 활용하는 데 어려움이 있다”고 꼬집었다.
네이버헬스케어 차동철 의료혁신실장 역시 “AI허브에 구축된 데이터는 오프라인 안심존, 온라인 안심존, 제한된 GPU 리소스 안에서만 활용할 수 있다”며 “오프라인은 연구자들이 직접 가서 연구하고 나와야 하는 등 자원 소모가 크기 때문에 기획 단계에서 바로 배제되고, 온라인도 GPU 제한 때문에 연구자들이 선호하지 않는다”고 지적했다.
차 실장은 또한 “공개된 데이터를 활용한 연구를 진행하기 위해 IRB 승인을 별도로 받아야 하는 등 접근성이 떨어진다”고 덧붙였다.
국립암센터 최귀선 암빅데이터센터장은 현재 데이터 공개가 공공기관에 편중돼 있다며 의료기관들의 참여를 위한 유인책이 필요하다고 조언했다.
최 센터장은 “의료기관이 많은 자원을 투자해 데이터를 구축∙관리하고 있음에도 이를 어떻게 활용하고 유통할지에 대해 정리가 돼있지 않다”며 “데이터 공개에 대한 인센티브를 마련해야 한다”고 주문했다.
병원별, 연구자별로 파편화돼 있는 데이터의 연계와 결합을 활성화할 필요성도 제기됐다.
최 센터장은 “결합 전문기관을 통한 결합 프로세스는 복잡하고 시간이 꽤 소요된다”며 “수요가 많은 데이터나 중장기 추적이 필요한 데이터의 경우 사전 결합 DB를 구축해 운영할 필요가 있다”고 말했다.
그러면서 “이런 결합 활성화를 위해선 데이터 표준이 중요하다. 표준단어, 용어, 도메인, 메타, 연계 표준 등에 대해 고려해야 할 시점”이라고 강조했다.