입력 2020.09.28 11:24
BioASQ 대회에서 미국 캘리포니아대학 샌디에고(UCSD), 매사추세츠대학 (UMass) 등 제쳐
강재우 교수팀, 의학-생물학 질문에 답하는 인공지능 모델 개발
1800만 개의 의생명 논문을 학습하여 개발한 AI 모델 “BioBERT”
고려대학교(총장 정진택) 컴퓨터학과 연구팀이 의학, 생물학 질문에 답하는 인공지능 시스템 경진 국제대회인 BioASQ 대회에서 미국 캘리포니아대학 샌디에고(UCSD), 매사추세츠대학 (UMass), 중국 푸단대학 (Fudan Univ), 일본 도쿄대학(University of Tokyo)를 제치고 2년 연속 우승했다. 고려대학교 팀은 정민별, 성무진, 김강우, 윤원진, 유재효 등 대학원생과 졸업생인 김동현 박사(현대자동차 AIR Lab), 그리고 지도교수인 강재우 교수로 구성된 7인 팀이다.
올해로 8번째를 맞는 BioASQ 대회는 가장 오래된 의생명 분야 질의응답 시스템 경진대회로 Google, 미국 국립보건원(NIH), 유럽연합 등이 후원한다. 이 연구팀이 참여한 BioASQ 8b Phase B챌린지는 주어진 논문에서 질문에 대한 답을 찾아내는 문제들로 구성되어 있다.
예를 들어 폐암에 관련된 논문을 주고 “폐암의 전이에 관여하는 유전자 변이는 무엇인가?”라는 질문을 하는 방식이다. 이 대회에 출전하는 인공지능모델들은 3개월에 거쳐 모두 5번의 시험을 보게 되며, 결과는 의사, 생물학자 등 해당 분야 전문가가 만들어 놓은 정답을 이용하여 평가되고, 전문가의 재검토를 거쳐서 발표되므로 신뢰도가 높다.
강재우 교수 연구팀은 작년 7회차 대회에서 ‘네/아니오’, 또는 ‘BRAF V600E 유전자 변이’와 같이 단답형 정답을 맞히는 ‘Exact’ 종목에 참여하여 Google(미국)을 제치고 5번의 평가 회차 모두에서 1위를 기록하여 ‘그랜드 슬램’을 달성한 바 있다.
올해 연구팀은 ‘Exact’ 종목 (정민별 석박통합과정 주도)에서 총 5회의 평가회차 중 1위 4회, 2위 1회로 매사추세츠대학(1위 1회), 후단대(2위 1회)을 꺾고 압도적인 성적으로 지난해에 이어 우승을 이어나갔다.
특히 올해는 이에 더불어 ‘BRAF V600E 유전자 변이는 전이성 비소세포폐암과 연관이 있습니다.’와 같이 서술형 문장으로 답을 만들어 제출하는 ‘Ideal’ 종목(윤원진 박사과정 주도)까지 참여하여 5회 중 1위 3회, 2위 1회로 캘리포니아대 샌디에이고(UCSD), 호주 맥쿼리대를 압도하며 우승하여 두 종목 모두를 석권하였다.
※이번 대회의 전체 결과는 http://bioasq.org/participate/eighth-challenge-winners 에서 확인할 수 있다.
이번 결과는 인공지능 모델 BioBERT(고려대)와 BART(facebook)를 이용하여 얻은 성과이다. 특히, BioBERT는 강재우 교수 연구팀(이진혁 박사와 윤원진 박사과정의 공동주도)이 개발한 의생명 분야 문헌에 특화된 딥러닝 언어모델로, 지난 1월 생명정보학 최고 권위지인 Bioinformatics에 게재된 이래 9월 말 기준 현재까지 440회 이상의 피인용횟수를 기록하고 있다. 또한 하버드, MIT, 스탠포드, 프린스턴, 구글, 아마존, 페이스북, 마이크로소프트 등 해외 유수의 인공지능 연구기관들이 BioBERT논문을 인용하고 있는 것에서 보이듯 학계의 관심도 뜨겁다. 이 논문은 Bioinformatics 저널의 가장 많이 읽힌 논문목록에 포함되었고(올해 8월), 국제의학정보학협회(IMIA) 연보의 BioNLP분야 올해의 논문 3편 중 하나로 선정되었다.
단답형 문제에 해당하는 Exact 종목에 정확한 답을 하기 위해, 연구팀은 BioBERT모델에 자연언어추론(Natural Language Inference)을 하는 능력을 강화한 BioBERT-NLI를 사용했다. 자연스러운 문장으로 답을 하는 Ideal 종목은 서술형 문제에 해당하는데, Exact 종목에서 나온 단답형 정답과 BART 언어 요약 모델을 활용하여, 정답 문장을 생성해낸다. 단순히 주어진 문서에서 문장을 선택하여 정답으로 사용하는 기존의 방식과는 달리 강재우 교수 연구팀은 정답 문장을 인공지능이 직접 작성해내는 방식을 처음으로 사용하였다. 이 덕분에 문장이 얼마나 자연스러운지 평가하는 항목인 Readability에서는 거의 만점에 가까운 점수를 받았다.
이번 연구는 의생명 도메인의 텍스트를 학습한 결과를 바탕으로 기존의 의생명 질의응답 시스템의 성능을 유의미한 수준까지 큰 폭으로 개선했다는 점에서 큰 의의가 있다. 또한, 사람이 읽기에 자연스러운 문장으로 질문에 대한 답을 할 수 있는 인공지능 시스템이라는 점에서 앞으로 임상적으로 유의한 의사결정 지원 도구를 개발하는데 활용될 수 있을 것으로 기대된다.
이번 대회의 결과는 학계와 Google, 글로벌 제약회사 등 산업계의 많은 관심 속에서 온라인으로 진행된 BioASQ워크샵에서 지난 9월 23일 발표되었다.