[메디게이트뉴스] 대한영상의학회 대표 학술저널인 Korean Journal of Radiology(IF 4.8, ‘KJR’)은 챗GPT(ChatGPT)와 같은 대형언어모델(Large Language Model, LLM)의 학술논문 작성에 대한 가이드라인을 지난 8월 발표했다. 기존의 가이드라인은 대부분 영어권 저널 및 단체들로부터 나왔으나 KJR가이드라인은 비영어권으로부터 나왔고, 영어를 모국어로 사용하지 않는 연구자의 입장을 반영한다는 점에서 국제적으로도 많은 관심을 불러 일으키고 있다.
최근 필자(황성일 분당서울대병원 영상의학과 교수)와 임준서 서울아산병원 교수는 비영어권 사용자들의 챗GPT를 사용한 논문작성법에 대한 “Is ChatGPT a “Fire of Prometheus” for Non-Native English-Speaking Researchers in Academic Writing?” 이라는 종설을 KJR에 게재했다. 이를 학자들에게 보다 알기 쉽게 설명하고자 하는 의도를 담았다.
우선 챗GPT는 영어를 잘하지 못하는 연구자들에게는 마치 프로메테우스의 불에 비유할 수 있다. 이 ‘불’을 잘 이용하면 연구자들이 영어 글쓰기 자체에 관해서는 부담을 더는 대신 연구 수행과 내용 및 결과에 대한 해석 및 생각에 좀 더 집중해서 더 좋은 연구를 만들어 낼 수 있다. 하지만 이 불을 잘못 사용하면 불에 데어 화상을 입거나 타 죽을 수도 있기 때문에 조심해야 한다는 의미로 지어봤다.
비영어권 사용자들의 영어권 사용자들에 비해 불리한 점은?
한국을 포함한 비영어권 국가에서도 대다수의 학술논문은 영어로 작성되고 있다. 이는 채용, 승진을 위한 학술업적에 절대적이다.
비영어권 저자들은 영어권 저자들에 비해 학문적 내용을 담는 것보다 영어 논문작성에 어려움을 겪는다. 영어논문 작성에는 문법이나 단어 등의 언어적 요소 뿐 아니라, 문장의 연결, 맥락 및 구성 등의 비언어적 요소들 모두가 필요하다. 최근 퍼블릭 라이브러리 오브 사이언스(Public Library of Science, PLoS) 생물학에 발표된 설문조사 연구에 따르면, 비영어권 연구자들은 영어권 연구자들에 비해 영어 논문작성과 구연발표에 각각 51%와 94%의 시간을 더 쓰지만 영어 문제로 인한 논문 탈락을 2.6배나 많이 경험하는 것으로 밝혀졌다 ( doi.org/10.1371/journal.pbio.3002184).
영어논문을 잘성할 때 LLM이 문장 작성에 도움을 줄 수 있는 부분이 있다. LLM의 논문작성에 대해서는 영역별로 차이가 있으나, 과학 영역은 설득적인 요소보다는 비교적 정형적인 구조에서 통계와 실험 등을 통한 객관적 기술이 많아, 실험방법과 결과 등의 핵심을 제외한 문장작성에서 도움을 줄 수 있다.
특히 비영어권 저자들은 영어로 문장을 쓰다가 더 이상 무슨 말을 써야 할 지 모르는 '블랭크페이지신드롬(Blank page syndrome)' 등이 자주 발생하는데, 논문의 소개나 고찰 부분에서 LLM을 잘 활용하면 이를 극복하는데 도움이 될 수 있다.
LLM을 사용할 때 주의할 점은 어떤 부분이 있는가?
LLM 사용시 주의사항에서 가장 잘 알려져 있는 이슈로는 ‘환각 (hallucination)’이 있다. LLM은 마치 맥락을 이해하는 것 같으나, 실제로는 항상 사실에 기반하지 않고 틀린 답이라도 ‘가장 그럴 듯하게’ 들리게 작성하게 학습돼 있다. 따라서 LLM에 의해 생성된 콘텐츠는 반드시 저자들이 잘못된 사실의 여부와 저자의 의도에 맞았는 지 검증해야 한다.
또한 표절 이슈도 생각해 볼 필요가 있다. 저자의 의도에 맞지 않는 생성된 문장도 광의의 AI표절로 볼 수 있고, 전통적인 타 참고문헌의 표절도 발생할 수 있어 기존 사용되고 있는 표절 탐지 프로그램들을 사용해 생성된 문장을 검증해야 한다.
마지막으로는 LLM의 사용을 위해 논문 데이터의 일부를 인터넷을 통해 외부 LLM에 전송하는 경우가 생길 수 있는데, 이때 환자와 병원의 구체적 정보가 전달되지 않도록 주의해야 한다.
목표 저널에 맞게 원고 준비하되, 영문 교정에 LLM 활용시 도움
많은 논문과 저널들에서 LLM의 사용을 제한하거나 문제점을 제시하고 있는데, 저널들마다 조금씩의 입장차이가 있다. 사이언스(Science) 같은 경우에는 가장 강하게 LLM을 통한 생성형 콘텐츠의 포함을 금지하나, 그 외 많은 저널의 경우에는 LLM을 포함한 AI툴의 작성 그 자체를 금지하기 보다는 투명성을 중요하게 여기고 이의 사용을 기술하는 것을 추천하고 있다.
그러나 JAMA(The Journal of the American Medical Association , 미국의사협회지) 등의 유력저널 들은 문법, 단어오류 등의 기본적 문법적 요소 수정에서는 LLM 사용을 기술하지 않아도 되고, KJR도 언어적 요소를 높이기 위한 사용에서는 같은 방침을 고수하고 있다. 목표 저널에 맞게 원고를 준비하되, 연구의 핵심이 되는 콘텐츠 생성에는 LLM을 배제하는 것이 현명하다고 볼 수 있다.
기존 비영어권 연구자들은 작성된 논문을 교정업체에 보내서 영문교정을 받는 것이 일반적이었다. 그러나 많은 경우 교정업체의 영문교정은 연구자체에 대한 이해가 미약한 경우가 많고, 쉽게 교정 가능한 문법이나 스펠링 등에 더 집중하는 경우가 많다. 더 큰 문제점은 상당한 금액을 교정에 지불함에도 불구하고, 대부분 일회성이며 추가 교정을 위해서는 더 고급옵션을 선택하거나 추가금액을 지불해야 하는 어려움이 있다.
LLM을 사용한다면 일부 월사용료가 있으나, 교정업체에 비해 압도적으로 저렴하고 맥락에 맞는 내용수정이 가능하다. LLM과 질의응답을 통해 연구자가 놓쳤던 부분을 추가할 수도 있으며, 문법적으로 완벽에 가까워서 교정에서 큰 도움을 줄 수 있다.
LLM 영어 논문작성에 활용할 수 있지만, 저자의 책임은 더욱 높아진 셈
이번 논문 공저자에 일본저자들이 포함돼 있고 저자가 일본대학병원 연수기간에 작성됐다. 연수기간 중 영어논문 작성의 어려움에 대해서 일본저자들과 많은 논의를 할 기회가 있었고, 유사한 환경임을 확인했다. 따라서 영어 논문작성의 어려움은 한국저자들 뿐 만이 아닌, 비영어권저자들에게 공통된 문제임을 확인해 이번 논문의 작성에 공저자로 참여하게 됐다.
영어에 대한 언어장벽도 최근 사회 전반에서 제기되는 ‘불평등’ 이슈와 맥락이 닿아 있는 것으로 보인다. LLM의 적절한 사용은 과학.학술분야에서 영어로 인해 발생하는 비영어권 연구자와 영어권 연구자 사이의 불평등을 해소하는 데 도움을 줄 수 있다는데 의견을 같이 해 이번 논문을 작성했다.
비록 LLM이 영어 문장작성에 큰 도움을 줄 수 있으나, 절대 LLM이 연구를 대신하거나 논문을 대신 써주는 것이 아니다. 오히려 저자의 책임은 LLM시대에 더 높아졌다고 볼 수 있다. 각 저자는 국제적 저자의 기준에 맞는 책임을 다해야 하고, LLM이던 참고문헌을 통한 전통적 논문작성이던 간에 논문안에 있는 모든 내용은 저자가 확인하고 검증해야 한다.
비영어권 저자들로서는 LLM을 통해 보다 본질적인 연구 자체에 집중할 수 있는 시간과 노력을 확보할 수 있다는 것이 가장 큰 장점이고, 좀 더 수준 높은 연구로 결실을 맺어야 할 것이다. 최근 LLM으로 작성된 기계적인 ‘가짜논문’들이 여러 저널들에 투고되는 상황이어서 경종이 울리고 있는데, 이들 논문과의 차이점을 확보하기 위해서도 보다 LLM을 잘 이해할 필요가 저자들에게 놓여있다고 생각한다.
※칼럼은 칼럼니스트의 개인적인 의견이며 본지의 편집방향과 일치하지 않을 수 있습니다.