메디게이트뉴스에서는 유전체 의학을 이해하기 쉽도록, 가정의학과 전문의이자 유전학 박사인 테라젠이텍스 바이오연구소 김경철 본부장의 칼럼을 연재합니다.
<1편> 미래의학이 다가오고 있다
<2편> 유전체 의학의 기초, 변이(variants)가 무엇인가?
<3편> 유전체 분석 방법, 플랫폼의 소개
<4편> 임상에 적용하기 (1) 질병예측 (Prediction): 유전자를 통한 질병 예측은 근거가 있는가?
<5편> 임상에 적용하기 (2) 맞춤치료 (Personalized)
<6편> 임상에 적용하기 (3) 정밀의료 (Precision)
<7편> 빅데이터와 AI
<8편> 액체생검
<9편> 영양과 유전, 영양유전체
<10편> 영양과 유전, 후성유전학
<11편> 약물과 유전, 약물유전체
<12편> 유전의학의 발달과 윤리 문제
<1편> 미래의학이 다가오고 있다
<2편> 유전체 의학의 기초, 변이(variants)가 무엇인가?
<3편> 유전체 분석 방법, 플랫폼의 소개
<4편> 임상에 적용하기 (1) 질병예측 (Prediction): 유전자를 통한 질병 예측은 근거가 있는가?
<5편> 임상에 적용하기 (2) 맞춤치료 (Personalized)
<6편> 임상에 적용하기 (3) 정밀의료 (Precision)
<7편> 빅데이터와 AI
<8편> 액체생검
<9편> 영양과 유전, 영양유전체
<10편> 영양과 유전, 후성유전학
<11편> 약물과 유전, 약물유전체
<12편> 유전의학의 발달과 윤리 문제
[메디게이트뉴스 윤영식 기자]
안젤리나 졸리 효과
“나는 내 이야기를 사적으로만 간직하지 않기로 결정했다. 왜냐하면 자신이 암의 위험에 노출되어있다는 것을 모르고 살아가는 여성들이 많기 때문이다. 삶에는 많은 도전이 동반된다. 우리가 두려워하지 말아야 할 것은, 우리가 통제하고 조율할 수 있는 도전들이 있다는 점이다.” 2013년 뉴욕타임스에 이러한 기고문을 냈던 안젤리나 졸리는 자신이 유방암에 걸리지 않았음에도 유방암이 걸릴 확률이 높다는 위험 때문에 정상적인 유방 조직을 제거했다고 밝혔다. 안젤리나 졸리가 말한 높은 유방암 확률은 BRCA 유전자 변이로 인해 유방암에 걸릴 확률이 70~80 퍼센트임을 말하는 것이다. 대중들은 당혹했다. 어떻게 유방암에 걸리지도 않았는데 그녀의 상징과도 같은 유방을 절제하는가? 그리고 과연 질병을 미리 예측하는 유전자가 있는 것인가?
BRCA 1 유전자는 17번 염색체에, BRCA2 유전자는 13번 유전체에 위치한 비교적 큰 크기의 유전자로, 선천적으로 이 유전자에 돌연변이가 있는 경우(300~500 여 개의 변이가 한 번에 있는 것을 말한다)는 해당 돌연변이가 없는 같은 나이의 여성에 비해 유방암에 걸릴 확률이 무려 7배가 증가된다. 다시 말해, 미국 여성이 평생 유방암에 걸릴 확률이 10%인데 BRCA 유전자에 돌연변이가 있으면 70% 이상의 평생 유병률이 예측되는 것이다. 만약, 비가 올 확률이 70~80% 라면 사람들은 어떻게 행동하나? 물론 비가 안 올 수도 있지만 대부분의 사람들은 일기예보를 활용해 우산을 준비하거나 야외 스케줄을 조정한다.
그럼에도 불구하고 안젤리나 졸리가 유방을 절제한 것이 잘 이해되지 않는 사람들이 많을 수 있다. 안젤리나 졸리의 경우, 어머니와 이모들이 각각 난소암과 유방암으로 사망했다. BRCA 유전자 변이는 유방암뿐 아니라 난소암도 증가시킨다. 이러한 개인의 경험과 질병에 대한 감수성으로 인해 예방적 유방절제술을 한 것은 비난받을 일이 아닌 충분히 가능한 개인의 선택이다(2년 뒤 안젤리나 졸리는 자궁과 난소마저 절제했다). 안젤리나 효과는 국내에 더 큰 반향을 가져왔는데, BRCA 유전자 검사 빈도가 급증했으며 최근 5년 사이에 예방적 유방 절제술이 5배나 급증하게 됐다(한국 외과학회, 2016년).
질병예측 유전자 검사는 점치는 수준인가?
이처럼 질병의 치료나 개인의 행동에 영향을 주는 결정적인 유전자를 '실행 가능한 돌연변이(actionable mutation)'라 하며, 지금까지 약 1천여 개가 발견됐다. 이런 유전자의 변이를 이용해 질병을 예측하는 것이 가능할까? 질병 예측을 통해 개인의 처방이나 행동을 다르게 할 수 있을까?
여전히 의료계의 일부에선 개인의 선천적인 유전적 변이, 특히 흔한 변이인 단일염기다형성(SNP)에 의한 질병 예측을 불신하는 분위기가 팽배하다. 최근 한 기사에서는 익명의 의사가 유전체에 따른 질병 예측을 '점치는 것'이라고 혹평했다(청년의사, 2017년 11월 30일자). 과연 유전자를 통한 질병 예측은 근거가 없는가? 그 익명의 의사가 한 '질병 예측은 근거가 없다'는 말은 근거가 있는가? 인간게놈프로젝트 이후 유전체 변이와 질병 연구는 크게 늘었다. 아래 그림 처럼 유전적 변이를 뜻하는 'variant'에 관해 2003년 이후 발표한 논문을 검색하면, 논문 수가 해마다 꾸준히 늘어 2017년 한 해만 1만 건 이상의 논문이 발표된 것을 알 수 있다. 그리고 유전체 연구는 실제로 이보다 더 많다.
한 예로, 비만 유전자로 잘 알려진 FTO(fat mass and obesity-associated gene) 유전자의 경우는 2천 개가 넘는 논문이 발표됐다. 그 중에서도 가장 많이 연구하는 SNP(단일염기다형성)인 rs9939609 변이만 해도 2017년 12월 기준으로 443개 논문이 있으며, 34개 논문을 기초한 메타분석에서도 유의한 결과를 냈다(표 1 참조).
더욱이 19년 간 추적한 코호트 연구에서 FTO rs9939609의 변이(AA)의 심혈관 질환 및 뇌혈관 질환 발생 위험도가 각각 1.905, 1.849에 달했다. 다른 위험 요인을 통제하고서도 질병 발생이 2배에 가까운 위험 요인이라는 것은 의미가 크다. 이러한 사례는 무수히 많다. 치매유전자로 잘 알려진 APOE 변이(E4/E4)의 경우도 치매 위험도를 7배나 증가시킨다. 엽산의 비가역적 대사 경로로 알려진 MTHFR 변이는 호모시스테인을 높이고 심혈관 질환과 유방암, 치매 등의 질병 위험도를 높인다.
질병을 예측한다는 것은 여전히 어려운 일이다. 질병을 예측하려면 질병에 영향을 주는 많은 독립변수들로 좋은 모형을 만들어야 한다. 이런 모형에 유전자의 변이가 차지하는 비율은 아직도 적다. 더군다나 단일 유전자 하나가 질병에 미치는 영향력(질병기여도)은 낮다. 그러므로 유전자 변이는 예측 도구라기 보다는 위험요인(risk factor)으로 인식하는 것이 좋다. 호모시스테인이나 CRP 염증 수치가 여러 연구(단면연구 혹은 코호트 연구 등)를 거쳐 심혈관 질환이나 암 질환의 위험요인이 된 것처럼, 유전적 변이도 여러 연구를 거쳐 위험요인, 즉 유전적 소인으로 자리매김하고 있다. 그 중 유전자와 질병 연관연구의 대표적인 연구 기법인 전장유전체 연관분석(GWAS)에 대해 알아보자.
GWAS 연구란 무엇인가?
유전체 기반 질병 연구는 2007년 이전까지 인간 게놈 프로젝트와 합맵 프로젝트에 의해 만들어진 지도를 가지고 보물이 있을 만한 곳을 직접 찾아 들어가는 방식을 택했다. 즉, 특정 질환에 영향을 주는 것으로 알려진 유전자 변이(SNP) 중 단백질의 구조를 바꾸는 변이, 혹은 유전체 전사(promotor) 부위의 변이(SNP)를 지정한 후 질병을 가진 그룹과 정상 대조군에서 SNP의 유전형이 어떤 지를 비교하는 연구였다. 이를 목표유전자연관분석(Candidate gene association study)이라고 불렀다. 또 이를 가설에 의한 연구(hypothesis driven study)라 부른다. 그런데 문제는 이렇게 미리 의심하고 들어간 유전자의 변이가 많은 비용과 시간을 들였음에도 불구하고 매번 실패로 끝나는 일이 빈번했다. 마치 모래사장에서 바늘을 찾거나 넓은 대해에서 낚시를 투척하고 한없이 물고기가 잡히기를 기다리는 것과도 같았다.
전장유전체 연관분석(GWAS: Genome-Wide Association Study)은 이와 달리, 두 개의 어선이 쌍끌이망을 통해 물고기를 다량으로 획득하듯이 아예 특정 질병군과 건강한 대조군의 전장 유전체를 분석한 후 의미 있는 유전체 변이(SNP)를 역으로 찾아내는 방식이다.
첫 번째 GWAS는 2005년 예일대 팀이 수행한 황반변성에 대한 연구인데, 96명의 황반변성 환자와 50명의 대조군을 통해 116,204개의 SNP 중 질병과 연관된 몇 개의 변이를 'CFH(complement factor H gene)'라는 단 하나의 유전자에서 찾아내는데 성공했다(Science 2015, 308(570): 385–389). 그 이후 심혈관 질환, 대장암, 유방암, 골다공증, 치매 등 2천여 개의 흔한 질병을 대상으로 한 GWAS 연구가 10년 사이에 3천 개 이상 발표됐다. 여기서 파생한 연구만해도 3백만 개 정도 된다. 이러한 전세계의 모든 GWAS 연구는 미국 정부가 'GWAS CATALOG'라는 공식 웹사이트에 공개해 누구라도 그 결과물을 볼 수 있게 해뒀다.
대규모 GWAS는 맞춤의학(personalized medicine)의 시대를 앞당기고 있다. 한 예로, C형 간염의 치료제로 쓰이는 인터페론과 리바비린의 치료 반응이 개인의 유전적 변이에 따라 다르게 나오는 것을 확인한 연구가 있는데, 해당 연구 결과 IL28B 유전자 주변의 SNP가 치료반응에 관여하는 것으로 알려졌다. 이런 대규모 연구가 가능하게 된 것은 DNA 칩(cDNA Microarray)이나 454(roche, 로슈), iPLEX(Sequenom, 시쿼놈), Solexa(illumina, 일루미나) 등이 대규모 플랫폼의 개발 덕분에 수십만에서 수백만 개의 SNPs를 동시에 분석하는 것이 비교적 싼 비용으로 가능해졌기 때문이다.
GWAS의 장점은 특정 질병과 관련된 유전적 변이를 최대한 간단하게 특정화하는 데 있다. 즉, 약 1천만 개에 달하는 유전적 변이 중 특정 질환과 관련한 변이를 수 개에서 십여 개로 범위를 좁히는 것이다. 어떻게 이 것이 가능할까? GWAS는 아래 <그래프 2>의 예처럼, 심장병을 가지고 있는 수백 명의 환자 군과 심장병이 없는 건강한 대조군의 DNA를 얻은 후 DNA 칩으로 측정한 수십만 개의 변이를 분석·비교해서 통계적으로 의미 있는 변이를 추려내는 방식으로 진행한다.
일반적으로 통계적으로 의미 있는 유의 수준의 기준은 P값 5X10-2(p-value=0.05)이다. 그러나 보고자 하는 독립변수가 많아지면 서로 교호작용(둘 이상의 현상이 서로 작용해 원인이 되고 결과도 되는 것)이 생겨서 이 기준으로 의미를 부여하기가 어려워진다. 이를 본페르니 효과(Bonferroni effect)라고 하는데, 이를 교정하기 위해서 일반적으로 유의 수준(p-value=0.001)을 독립 변수 개수만큼 나눠 보다 엄격한 기준을 적용한다. GWAS 연구는 이런 본페르니 교정을 통해 수십 만개에 해당하는 독립 변수에 5X10-8이라는 엄격한 기준을 적용하기 때문에 이를 통과한 유전체 변이는 불과 수 개만 남게 되는 것이다. 이런 과정을 통해 한 질병을 예측하는데 사용하는 유전체 변이를 10여 개 내로 좁힐 수 있다.
국내에서도 이런 GWAS 연구를 기반으로 하는 질병 유전체 예측 서비스를 상업적으로 할 수 있도록 질병관리본부에서 허락하고 있다. 물론 GWAS 연구에도 많은 한계가 있다. 수십만 개의 유전자를 동시에 분석하다보니 다중분석의 통계학적 오류가 발생하기도 하고, 대조군의 매칭이 어려운 경우도 있으며, 동일한 질병 연구 사이에 최종 마커의 불일치가 발생한다. 단면연구(Cross-sectional study)에서 얻은 교차위험비(Odd ratio)를 바로 질병 위험요인으로 적용하는데 무리가 있다는 지적도 있다. 그러기에 GWAS 연구들은 다시 재현성 연구(replication study)를 거치고, 많은 연구들 간의 메타분석을 실시해야 하며, 위험요인으로 규정하기 위해서 전향적 코호트 연구도 설계해야 한다. 그럼에도 GWAS 연구는 여전히 가장 강력한 질병연관 분석의 틀이며, 여전히 많은 저널들이 잘 설계된 GWAS 연구들을 논문으로 발표해오고 있다.
회사마다 유전체 예측이 다르다?
많은 회사가 앞선 연구들을 바탕으로 유전체 질병 예측 서비스를 시행하고 있다. 크레이 벤터는 미국의 대표적 유전체 질병 예측 서비스 업체인 23앤드미(23&me)와 네비제닉스(Navigenics)의 질병 예측 결과를 비교해 2009년 네이처에 발표했다. 그런데 아래 그림과 같이 두 회사의 결과가 일치하는 경우도 있었지만 정반대로 예측하는 경우도 있었다. 과학을 근거로 만들었다는 예측 서비스가 같은 사람을 대상으로 다른 결과를 보여준다면 소비자들의 혼란은 당연한 것이다.
이런 불일치는 왜 생기는 것일까? 가장 큰 이유는 회사마다 질병 예측에 사용하는 유전자와 변이 (SNP)을 다르게 골랐기 때문이다. 저 논문이 실린 2009년에는 GWAS 연구가 아직 많이 실시되지 않았을 때이며 대부분의 질병과 관련된 유전자 연구는 소규모 대상의 연구에서 인용된 것이다. 물론 오늘날 더 많은 연구들을 바탕으로 신뢰성 있는 유전자가 나왔지만 여전히 어떤 유전자와 변이를 사용할 지는 회사 고유의 권한이다. 한국에서는 이 질병 유전자를 고르는데 있어서 질병관리본부에서 가이드라인을 가지고 있는데, 즉 한국인이나 동아시아인 대상 연구가 있어야하고 최소 2개의 논문을 가지고 있어야 한다는 것이다. 그러나 오히려 특정 질병 (예를 들면 한국 연구자들이 아직 많이 연구하지 않은 질병 등)에서는 한국인 연구에 국한하는 것은 더 좋은 유전자를 고르는데 제한이되기도 한다.
정부에서 2016년 6월에 고시하여 소비자들에게 바로 유전체 검사를 할 수 있게 한 DTC (Direct to Customor) 서비스 경우 모든 회사가 정부에서 직접 정한 유전자를 사용해야 한다. 그러나 이 경우에도 같은 유전자에서 다른 SNP가 픽업될 수 있으며 여러 개의 유전자들을 질병 예측에 사용할 경우 회사마다 다른 가중치와 알고리듬을 적용하기에 여전히 다른 예측 결과물을 낼 수 있다.
어떤 회사의 유전체 예측이 제일 정확한가? 이를 단정하여 말할 수 없다. 그러나 유전체 예측 서비스를 직접 사용하는 의사들이 이제 유전체에 대한 기본 지식을 알아야하고, 의사들에게 회사들은 어떤 유전자가 사용되었는지, 어떤 SNP을 사용했는지를 공개해야 한다. 그러나 아쉽게도 많은 회사들이 이를 공개하고 있지 않다. 만약 SNP의 고유번호인 rs번호를 의사들이 알면 바로 검색해서 최근 논문들을 찾아볼 수 있고 유전적 위험에만 국한되지 않고 약물이나 생활 습관과의 연관성을 연구한 후속 논문들을 더 찾아내어 더 많은 임상적 의의를 붙일 수 있게 될 것이다.
또 한가지 질병 예측에 있어 중요한 것은 유전자만 가지고 질병 예측을 하는 것은 한계가 있고 또 위험한 일이기도 하다. 암과 심혈관 질환 등 주요 만성 질환이 유전자만 가지고 설명되지 않는다. 더 많은 경우에서 흡연, 비만, 음주, 운동 부족, 스트레스 등 환경 인자가 더 큰 영향을 준다. 따라서 질병 예측 모형을 만들 때 반드시 유전적인 위험과 함께 환경적인 위험을 같이 계산하여 설명해주어야 한다. 예를들면, 아래 그림과 같이 비록 폐암의 유전적 위험이 1.75배 높더라도 흡연을 하게되면 그 위험도는 12.5배나 훨씬 더 증가한다. 만약 8년간의 금연을 하면 질병의 위험이 더 낮아지기에 유전적 위험을 알려주는 것 못지 않게 생활습관을 개선시켜주는 것이 중요하다.
의사들이 유전체에 대해 잘 모를 때는 가격이 저렴한 서비스, 디자인이 예쁜 결과지 등을 선택 기준으로 삼았는지 모르지만, 질병을 예측하고 고객의 생활 습관을 바꾸기 위해서는 정확한 질병 예측 모델을 사용했느냐가 가장 중요한 기준이 돼야 한다. 그리고 이러한 기준에 따라 질병 예측 서비스가 의료에 이용되도록 하려면 의사들이 더 많이 알고 서비스 개선을 주도해야 한다.
유전체 질병 예측 서비스, 어떻게 활용할 것인가?
앞서 말한 것처럼 유전체 변이를 이용한 질병 예측 서비스에 대한 의료계와 소비자의 반응은 불신도 있고 반대로 맹신도 있다. 어떤 사람들은 유전체 변이의 결과를 듣고, 마치 그 병에 정말 걸리는 것처럼 불안해 하는 경우도 있다.
안젤리나 졸리의 BRACA 유전자의 변이처럼 매우 드물지만 변이가 있으면 평생 유병률이 70~80%나 되는 강력한 투과율(High penetration)을 보이는 유전성 암, 희귀 질환도 있지만, 대부분의 질병이 그렇게 유전자 하나만 가지고 결정되지는 않는다. 한 유전자의 투과율도 낮아서 1.5배에서 2.5배 정도의 위험도를 갖는다. 물론 이 정도의 위험도도 충분히 높고, 여러 개의 유전적 위험도가 모두 나쁜 경우 3배 이상의 유전적 위험도를 갖는 경우도 있다. 그럼에도 불구하고 이것은 어디까지나 유전적 위험도일 뿐이지 반드시 질병에 걸린다는 것을 의미하지는 않는다. 오히려 더 많은 환경 인자, 예를 들면 흡연, 운동부족, 과식, 술 등이 질병을 일으키는 더 중요한 요인으로 작용한다.
따라서, 유전적 위험과 환경적 위험은 진료 현장에서 적절하게 통합해 사용해야 한다. 그럼에도 유전적 위험도는 여전히 중요하다. 우리는 대장암 가족력이 있는 경우 대장 내시경을 더 권장하고 당뇨 가족력이 있는 경우 당화 혈색소에 보다 의미를 두고 강조한다. 가족력은 개인의 유전적 위험도를 직접 반영하지는 않는다. 당뇨인 아버지를 둔 자녀들이 모두 당뇨가 생기는 게 아니라 아버지의 당뇨 유전자를 물려 받아야 생기는데, 이 과정은 무작위이다. 그러므로 본인의 주요 질병에 대한 유전적 소인을 직접 아는 것은 의미가 있다. 그러나 여기서 끝나면 유전자 검사는 그야말로 운명을 점치는 것과 무엇이 다를까. 의사들은 환자의 유전적 소인을 이용해 생활습관을 개선하고 조기 진단으로 이어지게 해서 결과적으로 예측(prediction)과 예방(prevention)을 통해 그들을 더욱 건강하게 만들어야 하는 것이다.
진료실에서 치매 유전자 검사인 APOE 유전자 검사의 결과를 설명할 때, 이미 가족력이 있어 자신은 반드시 치매가 걸릴 것이라 믿고 있던 고객이 치매가 걸릴 확률이 30%(APOE E3/E4)라는 결과를 들으면 의외로 "생각보다 확률이 적어서 다행이네요"라고 말하는 경우를 종종 본다. 그러나 또 어떤 사람들은 남들보다 치매 걸릴 확률이 3배 높다는 말을 들으면 긴장하고 불안해 할 수 있다. 두 경우 모두 유전적인 위험이 3배, 30%인 것이지, 치매에 걸리지 않도록 좋은 생활 습관, 즉 운동을 정기적으로 하고 책을 즐겨 읽으며 남들과 좋은 인간 관계를 맺으면 질병에 걸릴 확률을 더 낮출 수 있다. 조기에 치매 스크린을 위한 인지기능 검사를 하고 치매를 예방할 수 있는 좋은 영양제를 복용하면 더 낮추거나 막을 수도 있다.
필자는 유전자 검사가 어떻게 나오든 간에 금연, 운동, 좋은 음식을 권한다. 즉 좋은 유전자를 타고 났다면 그 운명에 맞게 더 건강하게 살기를 권유하고, 혹시 나쁜 유전자를 타고 났더라도 더 좋은 생활습관을 가져서 유전적 위험을 극복할 것을 권유한다. 아래 그림이 좋은 예일 것이다. 비록 유전적 변이는 없지만 운동을 하지 않는 사람이 남들보다 쉽게 살찌는 유전자 변이(FTO 유전적 변이 AA형)를 타고 났지만 운동을 열심히 하는 사람보다 더 비만일 확률이 높다.
결과적으로, 유전자 예측 검사는 단순히 비가 온다는 확률만 제공하는 것이 아니라 비를 피할 방법, 우산을 준비하고 야외 행사 일정을 조정하는 등의 방법을 알려줘야 한다. 비가 오지 않을 수도 있고 예측이 틀릴 수도 있다. 그러나 여전히 우리는 늘 일기예보를 살펴보는 것처럼 인생에 많은 불확실성을 제거하고 예측 가능한 삶을 살기 위해 노력한다. 더 나아가 질병의 소인을 개인마다 알아내는 일은 질병을 예방하고 피하기 위해서도 큰 의미가 있다.