입력 2025.01.15 10:38
- 머신러닝 기반 화학 반응 예측의 정확도와 범용성을 혁신적으로 향상시키는 데이터셋 구축
연세대학교 화학과 심은지 교수 연구팀이 서울대학교 약학대학 이주용 교수 연구팀과의 공동연구를 통해 화학 반응을 자동으로 탐색하고, 반응 경로를 데이터화하는 혁신적인 방법을 개발했다.
이번 연구는 머신러닝을 활용해 복잡한 화학 반응의 예측 정확성과 효율성을 획기적으로 높이는 결과를 가져왔다는 평가를 받아 국제적 권위의 학술지 ‘어드밴스드 사이언스(Advanced Science)’에 1월 13일 게재됐다.
화학 반응은 분자 내 원자 간 결합이 끊어지고 새로 형성되는 복잡한 과정으로, 이를 컴퓨터로 정확히 시뮬레이션하기 위해서는 고도의 양자역학 계산이 필요하다. 그러나 기존 방식은 안정된 상태의 분자 구조만을 다루는 경우가 많아, 반응의 핵심인 전이 상태와 반응 경로를 충분히 반영하지 못했다. 이로 인해 머신러닝을 활용한 예측 모델에서도 한계가 있었다.
이에 심은지 교수 연구팀은 화학 반응 공간을 효율적으로 탐색하는 ‘반응 경로 샘플링 기법’을 개발했다. 이 기술은 반응 경로와 전이 상태를 자동으로 탐색해 데이터를 생성하며, 사람의 직관적 판단에 의존하지 않아 데이터 편향을 최소화했다. 연구팀은 이 기법을 활용해 고에너지 전이 상태를 포함한 반응 경로 데이터를 효과적으로 포착했으며, 이를 머신러닝 기반 원자간 포텐셜 학습에 적용해 모델의 예측 성능을 획기적으로 개선했다.
이 기법은 또한 계산 효율성 면에서도 탁월한 성과를 보였다. 타이트 바인딩 계산과 밀도범함수 계산(DFT)을 단계적으로 조합함으로써 기존 고수준 계산 대비 110배 이상의 속도로 데이터를 생성할 수 있었다. 이는 데이터 생성 과정에서 시간과 비용을 크게 절감하면서도 높은 품질의 데이터를 유지하게 했다.
연구팀은 개발한 데이터셋 생성 방법을 화학 반응을 예측하는 머신러닝 원자간 포텐셜에 활용해 복잡한 화학 시스템과 반응을 더 정확하게 모델링할 수 있음을 확인했다.
특히 이 기법은 계산화학 및 재료과학 분야의 연구자들에게 큰 도움이 될뿐만 아니라 신약 개발, 배터리 연구, 화학 공정 최적화 등 다양한 산업과 연구 분야에서 중요한 역할을 할 것으로 기대된다.
심은지 연세대 교수는 “이번 연구는 화학 반응 경로를 체계적으로 탐색하고 데이터를 생성하는 자동화 시스템을 제시한 것으로, 전 세계 연구자들이 쉽게 활용할 수 있도록 추가 개발을 통해 오픈소스로 제공할 예정”이라며, “향후 생체분자 반응이나 복잡한 화학 시스템에 적용되면 더욱 혁신적인 결과를 가져올 수 있을 것”이라고 연구 의의를 밝혔다.
이번 연구는 한국연구재단 중견연구자지원사업과 한국환경산업기술원의 ‘화학사고 예측예방 고도화 기술개발사업’의 지원을 받아 수행됐다.
(논문 정보)
논문 제목: Automated and Efficient Sampling of Chemical Reaction Space
논문 주소(DOI): https://doi.org/10.1002/advs.202409009