인기 키워드 순위

    메디게이트 뉴스

    유전체 기업과 블록체인 기술의 만남 그 시너지 효과는

    데이터 판매권이 기업에서 개인으로…DNA 데이터 크기 줄이는 연구도 진행 중

    기사입력시간 2018-05-15 06:20
    최종업데이트 2018-05-15 06:20

    사진: 게티이미지뱅크

    [메디게이트뉴스 박도영 기자] 올해 초 미국 스타트업 네뷸라 지노믹스(Nebula Genomics)가 가상화폐에 사용되는 블록체인(Blockchain) 기술로 개인이 DNA 정보를 사고파는 사업모델을 공개해 전 세계적으로 화제를 모았다. 이후 국내외 다양한 유전체 분석 기업들이 블록체인 기술 도입 소식을 전했다. 한 해외 스타트업은 최초로 유전자 염기서열을 이더리움 블록체인에 옮기는데 성공했다고 밝히기도 했다. 유전체 회사들은 왜 블록체인 기술에 주목하고 있고, 현재 어떻게 활용법을 찾고 있을까.

    유전체 분석에서 블록체인 기술을 도입하는 주요 요인 가운데 하나는 보안 수준이 높으면서 유지 비용이 낮다는 점이다.

    블록체인은 '블록(Block)'에 데이터를 담아 시간 순으로 '연결(Chain)', 즉 여러 대의 컴퓨터에 동시에 이를 복제해 저장하는 분산형 데이터 저장 기술이다. 블록기술이 사용된 가장 성공한 사례로는 가상화폐인 비트코인(Bitcoin)이 꼽히고 있다.

    블록체인에서는 거래가 발생한 시간 순서에 따라 모든 거래 데이터가 기록되고, 모든 네트워크 참여자(노드, Node)가 동일한 정보를 공유하기 때문에 기본적으로 모든 정보가 투명하게 개방된다.

    또한 노드 하나가 해킹으로 변조되더라도 블록체인 네트워크상 나머지 노드가 가지고 있는 데이터는 그대로다. 이 때문에 데이터를 임의로 변경하기 위해서는 네트워크에 참여하는 모든 컴퓨터를 동시에 해킹해야 한다는 어려움이 있다.

    블록에는 복사된 디지털 증거가 동일한지 입증할 수 있는 이전 데이터의 해시값(hash value)도 함께 보관돼 있고, 각 거래 데이터는 개인 키로 전자 서명이 돼 있어 해당 키를 확보하지 않는 한 위변조가 어렵다. 따라서 중앙 집중형으로 정보를 관리하는 것보다 보안성이 높다. 

    더불어 기존의 중앙 집중형 시스템에서는 데이터를 관리할 제3의 신뢰기관이 필요했지만, 블록체인에서는 모든 거래 참여자가 거래 내역을 확인하고 공증한다. 따라서 제3의 기관 설립 및 운영에 대한 비용을 절감할 수 있고, 제3자 공증이 없어 관련된 수수료도 들지 않는다.

    블록체인 기술은 금융산업뿐 아니라 다양한 분야에서 활용할 수 있다. 미국 메사추세츠공과대학(MIT)가 발행하는 기술분석 잡지 MIT 테크놀로지 리뷰(MIT Technology Review)는 블록체인 적용 시 혁명이 예상되는 5개 분야로 ▲에너지 ▲인터넷 광고 & 소셜 미디어 ▲식품 & 농업 ▲의학 ▲선거 등을 꼽았다.

    네뷸라의 사례를 보면 블록체인 기술이 어떻게 개인 유전체 정보를 보호할 수 있는지 알 수 있다. 기본적으로 네뷸라 네트워크는 블록스택(Blockstack) 플랫폼과 이더리움 기반 네뷸라 블록체인에 구축된다.

    데이터 소유자 노드(Data owner nodes)는 자신의 유전자 또는 표현형 정보를 공유하기 희망하는 개인으로, 블록스택을 사용해 데이터를 비공개로 저장하면서 누구에게 접근권을 줄지 제어할 수 있다.

    데이터 구매자 노드(Data buyer nodes)는 제약사나 생명공학회사로, 구매자 노드는 네뷸라 네트워크에서 사용되는 화폐인 네뷸라 토큰을 이용해 소유자 노드의 유전자 데이터를 구매해 안전한 컴퓨트 노드(Secure compute nodes)에서 데이터를 분석할 수 있다. 그리고 선택된 데이터 소유자에게 시퀀싱 비용에 대한 보조금을 지급하고, 설문지를 보내 표현형 데이터를 만들 수 있다.

    안전한 컴퓨트 노드는 네뷸라와 데이터 구매자, 제3자에 의해 운영할 수 있는데, 공유된 데이터는 인텔 SGX(Software Guard Extensions)와 동형암호(homomorphic encryption)를 사용해 암호화되고 분석되기 때문에 데이터 구매자는 절대 데이터 원문(plaintext)을 볼 수 없다.
     
    사진: 네뷸라 데이터 보안(출처=네뷸라 홈페이지)

    네뷸라 백서에서 설명하는 데이터의 흐름을 보면, 먼저 데이터 소유자 노드에서 데이터를 암호화한 뒤 보안 컴퓨트 노드에 전송한다. 보안 컴퓨트 노드에서는 암호화를 해제한 뒤 결과를 도출하고, 이 분석 결과를 다시 암호화한다. 데이터 구매자 노드는 암호화된 분석 결과 받고, 암호화를 해제한 뒤 결과를 확인할 수 있다.

    따라서 데이터를 공유하고 이에 대한 대가를 지불받는 동안 데이터 소유자는 익명으로 유지되며, 네뷸라 네트워크 주소는 개인 정보와 관련 없는 암호화 식별자로 만들어진다. 데이터 구매자는 네뷸라를 통해 신원이 완전히 확인된 사람에 한하며, 모든 데이터 트랜잭션(transaction) 기록은 네뷸라 불록체인에 영구적으로 저장된다.

    이 과정에서의 핵심은 데이터 소유권을 유전체 분석 회사가 아닌 개인이 갖고, 그 개인이 데이터 판매의 주체가 된다는 점이다.

    기존의 소비자 직접 의뢰(DTC) 개인 유전체 분석 전문기업들은 개인이 돈을 지불하면 분석 결과를 알려주고, 유전체 정보를 제약회사 및 생명공학회사에 연구 및 개발용으로 판매해왔다. 하지만 네뷸라 네트워크에서는 개인이 직접 네트워크에 가입해 구매자와 컨택하고 데이터를 판매할 수 있다.

    네뷸라는 데이터 분산 저장과 안전한 데이터 분석을 통해 유전체 데이터 보호하는 새로운 표준을 만들고 나아가 표현형 정보와 유전체 정보를 결합하는 시스템으로 확장할 계획이다.

    주정부가 직접 블록체인 기반 DNA 데이터 구축에 나선 사례도 있다. 독일 기반 유전체 스타트업 시봄(Shivom)은 3월 말 인도 안드라프라데시(Andhra Pradesh) 주와 파트너십을 체결했다.

    안드라프라데시주에는 현재 6000만 명이 거주하고 있으며, 주정부는 2025년까지 모든 거주민들의 유전자를 분석할 계획이다. 시봄은 시민들의 DNA 프라이버시를 유지하기 위해 블록체인 기술을 사용해, 암호화된 데이터를 저장한 뒤 지정된 사용자만 사용할 수 있도록 하는 한편 동시에 분산 저장을 통해 트랜잭션 비용을 절감할 예정이다.

    시봄 측은 이뿐만 아니라 타비 로이바스(Taavi Rõivas)에스토니아 전 총리와 안타나스 구오가(Antagonas Guoga) 유럽의회 의원 등 영향력 있는 사람들이 시봄의 성장과 개발 노력을 지원하기 위해 시봄혁신위원회(Shivom Innovation Council)에 가입했다고 밝혔다.

    이스라엘에 기반을 둔 스타트업 DNATix는 방대한 양의 DNA 데이터를 안전하고 익명으로 블록체인에서 전송할 수 있는 방법을 찾고 있다.

    올해 초 'Enterobacteria phage phiX174 sensu lato '라는 바이러스의 뉴클레오타이드 배열(nucleotide sequence) 전체를 블록체인에 업로드하는데 성공한데 이어 지난달에는 DNA 염기서열을 블록체인으로 옮기기 위한 개념 증명 시험(Proof of Concept)에 성공했다고 밝혔다. DNAtix 측에 따르면 DNA 염기서열 데이터 크기가 너무 커서 현재 블록체인 기술로 효율적으로 지원하기 어려우며, 이같은 개념 증명 시험 성공은 처음이다.

    DNATix는 독점적인 DNA 압축 알고리듬을 개발해 간결하고 생산성 높은 프로그래밍 언어인 파이썬(Python) 스크립트를 구현, DNA 염기서열 크기를 75% 줄였다. 현재 크기를 99%까지 감소시키는 것을 목표로 알고리즘 개선을 위해 노력하고 있다.

    DNATix는 최근 소프트웨어 소스코드를 공유하고 관리하는 저장소인 깃허브(GitHub)에 처음으로 오픈소스 DNA 압축 툴을 발표했다. 이 툴을 사용하면 FASTA 포맷으로 된 DNA 염기서열 크기를 25%까지 압축할 수 있다.

    블록체인 기술은 바이오 분야에서 다양하게 활용될 것으로 전망되고 있다.

    마이지놈박스스튜디오 윤영식 대표는 "대표적인 2세대 블록체인인 이더리움(Ethereum)은 통화에 특성화돼 있던 블록체인을 다른 용도로 사용할 수 있는 가능성을 열었다"면서 "블록체인 2세대가 아이디어의 현실화, 스마트 계약(Smart Contract)을 통한 거래, 분산원장 기술을 기반으로 이종 산업과 연결 가능성을 타진했다면, 3세대는 기존 산업과의 본격적 융합을 목표로 개발될 것으로 보인다"고 말했다.