[메디게이트뉴스 서민지 기자] 국가 암데이터를 통합 구축·관리하는 전문기관이 문을 열었지만, 여전히 데이터 구축과 표준화, 활용 측면에 있어서 갈 길이 먼 상황이다.
국회의원 홍정민, 이용우, 신현영 의원은 지난 28일 공동으로 '공공 의료빅데이터 어떻게 활용할 것인가? 국가암데이터를 중심으로'를 주제로 한 토론회를 열고, 개선방안에 대한 전문가 의견을 수렴했다.
지난해 암관리법이 개정되면서 올해 9월 국립암센터가 국가암데이터센터로 지정됐다.
국가암데이터센터는 암 진료와 임상 데이터, 암 발생·사망 데이터, 국가암관리사업 데이터, 기관 연계 데이터, 연구데이터 등을 수집하고, 이를 처리, 분석하는 사업을 시행하는 전문기관이다.
암센터는 국가암데이터센터로 지정됨에 따라 전주기 암데이터 활용 활성화를 위해 전주기 국가 암 빅데이터 생산·축적, 암 빅데이터 거버넌스 구축, 데이터 활용서비스 확대, 빅데이터 인공지능 기반 R&D 확대 등을 추진할 예정이다.
우선 올해부터는 암 데이터 사업에 필요한 국가 단위의 암 데이터를 수집, 구축할 계획이며, 오는 2023년부터 안전하고 효율적인 개방 체계와 플랫폼을 마련하는 한편, 2024년에는 암 데이터의 공익적 활용을 극대화하기 위해 연구 사업 활성화에 나설 방침이다.
국가전문기관이지만 인력 부족 심각…정부 전향적 지원 필수
임정수 국가암관리사업본부장은 "암 관련 빅데이터를 구축하고 수집항목을 표준화한 후 가명처리까지 진행해 다양한 분야에서 이를 활용할 수 있을 것"이라며 "검진자료와 환자 건강기록, 유전체 자료, 웨어러블 데이터 등을 활용하면 암 발생을 사전에 예측하고 맞춤형 치료 옵션도 제시할 수 있다"고 말했다.
또한 "임상사진과 방사선 영상 등을 인공지능으로 분석해 높은 민감도와 특이도로 악성병변을 분류해낼 수 있으며, 신약개발에 활용해 비용과 시간을 대폭 단축하는 데도 도움이 될 것"이라며 "빅데이터 구축과 활용으로 암 예방과 진료 수준이 획기적으로 개선될 수 있다"고 내다봤다.
실제 위더스제약은 국립암센터와 연세암병원, 건양대병원, 화순전남대병원 등의 자료를 통합, 분석, 활용해 유방암 환자 항암제를 연구해 신약개발 성공 확률을 높였고, 에비드넷은 국립암센터와 삼성서울병원, 연세암병원, 가천대길병원, 전북대병원의 데이터를 활용해 헬스케어 AI 모델을 개발했다.
공공의료데이터를 활용한다면 공익적, 산업적 측면에서 다양한 이점이 있을 것으로 예상되지만, 이를 위해서는 인력 증원이 필수라는 지적이 나왔다. 현제 센터 내 빅데이터 인력은 데이터결합팀 4명, 데이터운영팀 7명, 데이터활용팀 5명 등 총 16명에 그친다.
임 본부장은 "그간 암 공공의료데이터 구축을 위한 일관성 있는 정책과 업무 수행하고 있지만, 향후 지속가능한 중추적인 역할을 수행하기 위해서는 최소 전문인력 49명을 증원해야 한다"면서 "미래지향적인 데이터센터 마련하고 암연구 생태계 조성 안전한 활용을 위해 정부의 전향적인 지원이 필요하다"고 강조했다.
보건의료공공데이터 구축과 활용을 담당하는 건강보험심사평가원도 빅데이터 구축과 활용을 활성화하려면 조직과 인력, 거버넌스, 투자 확대 등이 이어져야 한다는 입장이다.
심평원 신현웅 기획상임이사는 "보건의료데이터 특성상 쓸만한 게 없고 쓸만한 데이터라도 지나치게 독점적이어서 활용도가 떨어진다는 지적이 있다. 심평원에서도 데이터 품질관리, 표준화와 함께 연계, 결합, 활용 방안을 고민하고 있다"면서 "먼저 언제든지 상용화할 수 있는 플랫폼을 구축해야 하고, 여러 기관의 개방자료와 센터 내 자료들을 연계해야 한다. 이와 함께 인력과 조직에 대한 투자를 늘리고 개인정보보호와 빅데이터 발전을 균형있게 만드는 제도적 체계 개선도 이어져야 한다"고 했다.
학계·산업계 "데이터 활용 활성화…쉽고 간편하게"
네이버 클라우드 류재준 이사는 암데이터의 무궁무진한 활용 가능성을 언급하면서, 산업계에 적극 개방하고 활용해야 한다고 제언했다.
류 이사는 "개인정보 유출을 이유로 의료데이터 활용이 매우 제한돼 있는 상황이다. 이로 인해 헬스케어 기업들의 서비스 대부분이 구매력이 없어 산업이 성장하지 못하는 실정"이라며 "사실상 해킹된 사례를 보면 대부분 보안환경을 제대로 갖추지 않아 발생한 것으로, 현재 보안기술을 적용하면 충분히 방어할 수 있다. 미국 정부도 아마존에 유전자데이터를 올려 사용 중"이라고 말했다.
그러면서 "암 분야는 데이터공유가 제한돼 다양한 서비스가 없는데, 그에 비해 관심도는 매우 높다. 실제 네이버 검색만 봐도 하루 평균 6대암 검색이 5000건, 키워드검색은 5만건에 이르며, 전체 암으로 확대하면 수십만건"이라며 "암데이터를 구축하는 데 그치지 말고 산업계에 적극 개방하고 활용하는 체계도 마련해야 한다"고 강조했다.
서울대 보건대학원 성주헌 교수는 "국가암데이터센터는 암관리사업 뿐 아니라 다양한 공익연구, 신의료기술 연구 등의 광범위한 분야에서 혁신연구를 가능하게 하는 인프라가 될 것"이라며 "다만 현재 갖춘 기간 데이터시스템 외에도 분야별, 암주기 연구목표별, 데이터 종별의 통합성과 데이터 확보를 위한 지속적인 지원과 노력이 이어져야 한다"고 밝혔다.
성 교수는 "데이터 기반의 암 연구가 발암요인 규명 및 평가, 위험도 기반의 검진시스템, 신치료물질 스크리닝으로 발전하는 양상을 보이고 있다"면서 "혁신적인 연구 활성화를 위해서 개방형 공동연구 시스템이 필요하다. 암센터 내 자체 인력 뿐 아니라 개방형 공동연구 인력 확보하고, 같이 데이터 사용하고 만드는 선순환 구조를 만들어야 한다"고 제언했다.
분당서울대병원 김지현 정밀의료센터장 역시 "연구가 성공적이려면 좋은 데이터가 있어야 한다. 반대로 데이터 질이 좋지 않으면 연구결과에도 악영향을 준다"면서 "데이터를 많이 구축하고 정제하는 과정도 중요하지만, 궁극적으로 이를 다양하게 활용해 이득을 창출해야 한다. 따라서 데이터 제공자에 국한하지 않고 산업계 활용도 가능하게 하는 대책을 마련해야 한다"고 말했다.
코어라인소프트 최정필 대표는 '데이터 없이 AI도 없다'는 내용을 주제로 "인공지능 의료기기에서는 데이터가 필수지만, 여전히 데이터 활용에 있어 많은 제약과 불편함이 존재한다"면서 "헬스케어 핵심 기술인 인공지능 기술 개발을 위해서는 고품질의 공공 의료데이터가 매우 절실한 만큼, 앞으로 국가암데이터센터가 중추적인 역할을 통해 데이터의 안전하고 효율적 이용을 도모해야 한다"고 발표했다.
다만 암시민연대 최성철 대표는 개인정보 유출과 남용 등을 우려하면서, "식별 가능성이 매우 크기 때문에 유전자 정보 접근 제한을 유지해야 하며, 이와 함께 악용이나 오남용시 법적 처벌을 대폭 강화해야 한다. 빅데이터 활용시 데이터윤리위원회 통해 개인정보 활용 기준과 범위도 사전에 논의, 검증해야 한다"고 밝혔다.
국회의원 홍정민, 이용우, 신현영 의원은 지난 28일 공동으로 '공공 의료빅데이터 어떻게 활용할 것인가? 국가암데이터를 중심으로'를 주제로 한 토론회를 열고, 개선방안에 대한 전문가 의견을 수렴했다.
지난해 암관리법이 개정되면서 올해 9월 국립암센터가 국가암데이터센터로 지정됐다.
국가암데이터센터는 암 진료와 임상 데이터, 암 발생·사망 데이터, 국가암관리사업 데이터, 기관 연계 데이터, 연구데이터 등을 수집하고, 이를 처리, 분석하는 사업을 시행하는 전문기관이다.
암센터는 국가암데이터센터로 지정됨에 따라 전주기 암데이터 활용 활성화를 위해 전주기 국가 암 빅데이터 생산·축적, 암 빅데이터 거버넌스 구축, 데이터 활용서비스 확대, 빅데이터 인공지능 기반 R&D 확대 등을 추진할 예정이다.
우선 올해부터는 암 데이터 사업에 필요한 국가 단위의 암 데이터를 수집, 구축할 계획이며, 오는 2023년부터 안전하고 효율적인 개방 체계와 플랫폼을 마련하는 한편, 2024년에는 암 데이터의 공익적 활용을 극대화하기 위해 연구 사업 활성화에 나설 방침이다.
국가전문기관이지만 인력 부족 심각…정부 전향적 지원 필수
임정수 국가암관리사업본부장은 "암 관련 빅데이터를 구축하고 수집항목을 표준화한 후 가명처리까지 진행해 다양한 분야에서 이를 활용할 수 있을 것"이라며 "검진자료와 환자 건강기록, 유전체 자료, 웨어러블 데이터 등을 활용하면 암 발생을 사전에 예측하고 맞춤형 치료 옵션도 제시할 수 있다"고 말했다.
또한 "임상사진과 방사선 영상 등을 인공지능으로 분석해 높은 민감도와 특이도로 악성병변을 분류해낼 수 있으며, 신약개발에 활용해 비용과 시간을 대폭 단축하는 데도 도움이 될 것"이라며 "빅데이터 구축과 활용으로 암 예방과 진료 수준이 획기적으로 개선될 수 있다"고 내다봤다.
실제 위더스제약은 국립암센터와 연세암병원, 건양대병원, 화순전남대병원 등의 자료를 통합, 분석, 활용해 유방암 환자 항암제를 연구해 신약개발 성공 확률을 높였고, 에비드넷은 국립암센터와 삼성서울병원, 연세암병원, 가천대길병원, 전북대병원의 데이터를 활용해 헬스케어 AI 모델을 개발했다.
공공의료데이터를 활용한다면 공익적, 산업적 측면에서 다양한 이점이 있을 것으로 예상되지만, 이를 위해서는 인력 증원이 필수라는 지적이 나왔다. 현제 센터 내 빅데이터 인력은 데이터결합팀 4명, 데이터운영팀 7명, 데이터활용팀 5명 등 총 16명에 그친다.
임 본부장은 "그간 암 공공의료데이터 구축을 위한 일관성 있는 정책과 업무 수행하고 있지만, 향후 지속가능한 중추적인 역할을 수행하기 위해서는 최소 전문인력 49명을 증원해야 한다"면서 "미래지향적인 데이터센터 마련하고 암연구 생태계 조성 안전한 활용을 위해 정부의 전향적인 지원이 필요하다"고 강조했다.
보건의료공공데이터 구축과 활용을 담당하는 건강보험심사평가원도 빅데이터 구축과 활용을 활성화하려면 조직과 인력, 거버넌스, 투자 확대 등이 이어져야 한다는 입장이다.
심평원 신현웅 기획상임이사는 "보건의료데이터 특성상 쓸만한 게 없고 쓸만한 데이터라도 지나치게 독점적이어서 활용도가 떨어진다는 지적이 있다. 심평원에서도 데이터 품질관리, 표준화와 함께 연계, 결합, 활용 방안을 고민하고 있다"면서 "먼저 언제든지 상용화할 수 있는 플랫폼을 구축해야 하고, 여러 기관의 개방자료와 센터 내 자료들을 연계해야 한다. 이와 함께 인력과 조직에 대한 투자를 늘리고 개인정보보호와 빅데이터 발전을 균형있게 만드는 제도적 체계 개선도 이어져야 한다"고 했다.
학계·산업계 "데이터 활용 활성화…쉽고 간편하게"
네이버 클라우드 류재준 이사는 암데이터의 무궁무진한 활용 가능성을 언급하면서, 산업계에 적극 개방하고 활용해야 한다고 제언했다.
류 이사는 "개인정보 유출을 이유로 의료데이터 활용이 매우 제한돼 있는 상황이다. 이로 인해 헬스케어 기업들의 서비스 대부분이 구매력이 없어 산업이 성장하지 못하는 실정"이라며 "사실상 해킹된 사례를 보면 대부분 보안환경을 제대로 갖추지 않아 발생한 것으로, 현재 보안기술을 적용하면 충분히 방어할 수 있다. 미국 정부도 아마존에 유전자데이터를 올려 사용 중"이라고 말했다.
그러면서 "암 분야는 데이터공유가 제한돼 다양한 서비스가 없는데, 그에 비해 관심도는 매우 높다. 실제 네이버 검색만 봐도 하루 평균 6대암 검색이 5000건, 키워드검색은 5만건에 이르며, 전체 암으로 확대하면 수십만건"이라며 "암데이터를 구축하는 데 그치지 말고 산업계에 적극 개방하고 활용하는 체계도 마련해야 한다"고 강조했다.
서울대 보건대학원 성주헌 교수는 "국가암데이터센터는 암관리사업 뿐 아니라 다양한 공익연구, 신의료기술 연구 등의 광범위한 분야에서 혁신연구를 가능하게 하는 인프라가 될 것"이라며 "다만 현재 갖춘 기간 데이터시스템 외에도 분야별, 암주기 연구목표별, 데이터 종별의 통합성과 데이터 확보를 위한 지속적인 지원과 노력이 이어져야 한다"고 밝혔다.
성 교수는 "데이터 기반의 암 연구가 발암요인 규명 및 평가, 위험도 기반의 검진시스템, 신치료물질 스크리닝으로 발전하는 양상을 보이고 있다"면서 "혁신적인 연구 활성화를 위해서 개방형 공동연구 시스템이 필요하다. 암센터 내 자체 인력 뿐 아니라 개방형 공동연구 인력 확보하고, 같이 데이터 사용하고 만드는 선순환 구조를 만들어야 한다"고 제언했다.
분당서울대병원 김지현 정밀의료센터장 역시 "연구가 성공적이려면 좋은 데이터가 있어야 한다. 반대로 데이터 질이 좋지 않으면 연구결과에도 악영향을 준다"면서 "데이터를 많이 구축하고 정제하는 과정도 중요하지만, 궁극적으로 이를 다양하게 활용해 이득을 창출해야 한다. 따라서 데이터 제공자에 국한하지 않고 산업계 활용도 가능하게 하는 대책을 마련해야 한다"고 말했다.
코어라인소프트 최정필 대표는 '데이터 없이 AI도 없다'는 내용을 주제로 "인공지능 의료기기에서는 데이터가 필수지만, 여전히 데이터 활용에 있어 많은 제약과 불편함이 존재한다"면서 "헬스케어 핵심 기술인 인공지능 기술 개발을 위해서는 고품질의 공공 의료데이터가 매우 절실한 만큼, 앞으로 국가암데이터센터가 중추적인 역할을 통해 데이터의 안전하고 효율적 이용을 도모해야 한다"고 발표했다.
다만 암시민연대 최성철 대표는 개인정보 유출과 남용 등을 우려하면서, "식별 가능성이 매우 크기 때문에 유전자 정보 접근 제한을 유지해야 하며, 이와 함께 악용이나 오남용시 법적 처벌을 대폭 강화해야 한다. 빅데이터 활용시 데이터윤리위원회 통해 개인정보 활용 기준과 범위도 사전에 논의, 검증해야 한다"고 밝혔다.