인기 키워드 순위

    메디게이트 뉴스

    연구의 재현성이 개발을 어렵게 한다

    [칼럼] 한국아브노바연구소 배진건 소장

    개방형 혁신의 성공열쇠는 '데이터의 재현성'

    기사입력시간 2017-11-10 07:00
    최종업데이트 2017-11-10 07:00

    사진: 게티이미지뱅크

    [메디게이트뉴스 윤영식 기자] 1977년 9월 위스콘신 약대 대학원 첫 학기에 필수과목인 '생화학 601'을 수강했다. 대학원 수강과목의 학점은 보통 A나 B로 학부에 비해 상대적으로 후했지만, 생화학 601 과목은 C를 주면서 잡초 제거 과목으로 유명했다. 약대 등 다른 과 학생들은 생화학과 대학원생들에 비해 당연히 불리했고, 한국에서 실험 경력이 많지 않았던 필자는 더욱 어려운 상황이었다.

    첫 몇 주 강의는 클리랜드(W. W. Cleland) 교수의 효소반응속도론(enzyme kinetics) 강의였다. 이분은 자기 이름을 붙인 '클리랜드 시약(Cleland's reagent)'을 이용해 효소의 물리화학적인 성질을 어려운 수식으로 풀어내던 분이셨다. 첫 시험에서 최고 점수가 겨우 50점 정도 나오도록 문제를 어렵게 출제해 학생들의 기를 죽였다. 그는 첫 강의에서 연구를 통해 그 결과를 논문으로 써야 살아남는 연구자 초년생들에게 '출판된 논문(published paper)'의 70%는 'shit'(똥)이라고 강조했다. 그 당시엔 이 말이 도저히 이해가 가지 않았다.

    2000년 초 쉐링플라우(Schering-Plough)에서 라스(Ras) 암 유전자 연구를 했다. 라스가 활성을 갖기 위해 C-터미날(C-terminal)이 변화돼야 하는데, 첫 과정이 라스의 마지막 네 개의 아미노산 CAAX 중에서 시스테인 C에 15개의 불포화 지방산이 파르네실화(farnesylation)되는 것이다. 그 다음에 세 개의 아미노산 AAX가 RCE(Ras Converting Enzyme)에 의해 잘라지고, 마지막으로 카복시기(COOH)가 안정화 되기 위해 메틸화(methylation)가 돼야 한다. RCE는 아미노산 사이를 가수분해하는 효소 펩티디아제(peptidase)이기에 활성 사이트(active site)가 어떤 아미노산 종류인가를 알면 저해제를 만들기가 한층 쉬워진다. 마침 저해제에 대한 힌트를 찾을 수 있는 논문이 발표됐는데, 유타대의 포울터(Poulter) 교수가 교신저자로 참여한 'Studies with recombinant Saccharomyces cerevisiae CaaX prenyl protease Rce1p'라는 논문이었다.

    논문에서 특정 부위(Site-Directed) 돌연변이 유도를 통해 4개의 아미노산 자리(H194A, E156A, C251A, H248A)가 효소를 불활성 하게 만들었고, 각종 저해제 실험결과와 함께 시스테인(cysteine) 펩티디아제라고 결론지었다. 저해제 약을 만들기 위해서는 어떤 아미노산이 활성부위의 가장 중심에 있는가에 대한 정보가 중요하다. 우리 연구실에서 이 결과를 그대로 재현하려고 실험했다. 특별히 효소기질과 유사한 N-Acetyl-Cys(farnesyl) Chloromethyl Ketone이 비가역적으로 저해하기에 시스테인(cysteine)이나 세린(serine) 펩티디아제라고 결론지을 수 있으나, RCE에 존재하는 C251A를 포함해 시스테인 8개를 모두 돌연변이 유도를 만들었지만 활성에 전혀 이상이 없었다. 포울터(Poulter) 교수의 논문 결과가 재현되지 않아 어떤 종류의 펩티다아제인지 확신할 수 없어 연구는 미궁에 빠졌다.

    결국, 필자와 함께 이 문제를 여러 번 논의했던 조지아대의 슈미트(Schmidt)교수가 2006년에 보고된 3개의 아미노산 자리에 H248A와 E157A를 더 밝혀 세포막 안에 활성자리가 있고, 글루탐산염(Glutamate)과 히스티딘(Histidine)이 활성의 근본인 금속단백질분해효소(metalloprotease)라는게 밝혀졌다. 이때서야 연구 초년병 시절 클리랜드 교수가 말했던 논문의 재현성에 대해 실감하기 시작했다.

     
    [그래프] 연구의 재현성(reproducibility)에 대해 위기가 찾아왔는지를 묻는 설문에 대한 결과 (출처: Nature 자료 편집, 조사대상: 전세계 의과학계연구자 1576명)   

    과학은 '확증(corroboration)'에 의해 전진한다. 어떤 연구자의 연구보고가 다른 연구자에 의해 재현되고 일반화될 때 보강되고 다음 단계로 전진하게 된다. 그러기에 연구 재현성(reproducibility)은 연구결과의 진실성과 객관성을 판단하는 중요한 지표 중 하나이다. 연구가 거짓이나 틀린 결론을 쫓아가면 지연되는 것은 물론이고 많은 돈과 시간이 낭비된다. 2016년 학술지 네이처(Nature)가 전세계 의과학계 연구자 1576명에게 물었더니, 52%가 '연구의 재현성이 없거나 부족한 논문이 대부분'이라고 답했고, 단 7%만 '문제될 것 없다'고 답한 것으로 조사됐다(Nature, 28 July 2016).

    연구가 정당성을 가지려면 당연히 그 연구는 재현될 수 있어야 하지만 현실은 재현성의 위기라는 말이 나올 만큼 심각하다. 연구결과의 유효성을 검증하는 '피어리뷰(peer review)'를 거쳐도 문제가 많은데 불완전한 결론을 언론에 먼저 부풀려서 공개하는 것도 짚고 넘어가야 한다. 미디어에서 '세계최초 ○○질환 발병기전 규명'이라는 제목의 뉴스를 흔히 접하곤 한다. 나중에 시간이 지나 결과가 잘못된 것으로 판정이 나더라도 나 몰라라 넘어간다.
     
    신약개발분야에서 R&D 투자 대비 성과 감소와 시장경쟁 증가로 인해 개방형 혁신(Open Innovation)이 보편화 됐다. 자체 역량만으로 R&D를 하던 전통적인 폐쇄형에서 벗어나 혁신적인 아이디어, 지식 및 새로운 기술을 공유하는 개방형 혁신으로, 개발후보의 도입이 경쟁력 확보를 위한 필수 요소로 작용하고 있다. 그러나 개방형 혁신의 가장 큰 문제는 데이터의 재현성이다. 대학이나 연구소의 혁신적인 연구결과를 기술이전을 받았는데 재현이 되지 않아 개발이 지연되고 문제가 되는 것이다. 재현성을 가진 데이터가 정말 중요하다.

    재현성의 위기는 단지 우리만의 문제가 아니다. 10월 16일자 피어스바이오테크(FierceBiotech)에 재밌는 기사가 실렸다. '아스트라제네카가 아서타의 가짜 암 약물 데이터를 샀다고 시인했다(AstraZeneca buy Acerta faked cancer drug data, company admits)'는 제목의 기사다. 아스트라제네카(AZ)와 같은 대형 다국적제약기업이 40억 달러를 지불하고 인수한 항암제도 거짓 데이터 때문에 곤욕을 치르고 있는 것이다.

    개방형 혁신이 성공하려면 신뢰성 있고 재현성 있는 데이터가 가장 중요하다. "I’m from Missouri… show me data." 이미 소개한 니들만 박사의 10계명 중 하나이다. 미주리 출신답게 '나에게 데이터를 보여 확신 시키라'는 것이다. 무엇보다도 확신이 서는 데이터가 최고이다. 그것을 바탕으로 한 계단 한 계단 신약으로 전진할 수 있다.