왼쪽부터 서울대학교 화학생물공학부 정유성 교수(교신저자), 서울대학교 화학공정신기술연구소 김성민 박사후연구원 제1저자 (사진=서울대학교 제공)
[뉴스토마토 임삼진 객원기자] 서울대학교 화학생물공학부 정유성 교수팀과 미국 포덤대학교(Fordham University) 연구팀은 공동 연구를 통해 거대언어모델(Large Language Model, LLM)을 활용해 신소재의 합성 가능성을 예측하고, 그 예측 근거를 해석하는 기술을 개발하는 데 성공했다고 밝혔습니다.
이 연구성과는 신소재 설계 과정에서 합성 가능성(synthesizability)이 낮은 후보 물질을 사전에 걸러내거나 기존에 합성이 어려웠던 물질을 보다 합성 가능성이 높은 형태로 최적화하는 데 기여할 것으로 기대됩니다.
이 연구 결과는 화학 분야 국제 저명 학술지인 미국화학학회지(Journal of the American Chemical Society, JACS)에 지난해 7월 게재된 바 있고, 독일응용화학학회지(Angewandte Chemie International Edition)에 지난 2월 13일 ‘거대언어모델을 활용한 무기 결정 구조의 설명 가능한 합성 가능성 예측(Explainable Synthesizability Prediction of Inorganic Crystal Polymorphs using Large Language Models)’이라는 논문으로 게재되었습니다.
신소재를 개발할 때 소재의 합성 가능성을 정확하게 평가하는 과정은 매우 중요합니다. 합성 가능성을 충분히 고려하지 않은 상태로 소재가 설계되면 성공 가능성이 낮은, 불필요한 실험이 이루어지게 되고, 이는 연구 자원과 시간을 비효율적으로 소모하는 주요 원인이 됩니다. 이 때문에 신소재의 합성 가능성을 예측하는 정교한 기술이 필요합니다.
기존의 예측 기술은 소재의 열역학적 안정성을 지표로 평가하는 수준에 머물렀기 때문에 그 정확도가 낮았고, 이 때문에 평가 결과가 실제 실험의 합성 성공률과 크게 차이 나는 경우가 많았습니다. 이 문제를 보완하기 위해 개발된 기계학습 모델도 합성 가능성을 분류하는 데 그쳤으며, 무엇보다 예측 근거를 명확하게 설명하지 못하는 약점, 즉 해석 가능성(explainability)을 확보하지 못해 그 신뢰도가 낮았습니다.
거대언어모델을 신소재의 합성 가능성 예측에 적용하는 과정의 모식도(사진=서울대학교 제공)
서울대학교 화학생물공학부 정유성 교수팀은 이러한 도전 과제를 해결하기 위해 LLM을 도구로 활용하면 무기 결정 구조(Inorganic Crystal Polymorphs)의 합성 가능성을 정확하게 예측할 수 있을 뿐 아니라 해석 가능성도 확보할 수 있다는 사실을 밝혀냈습니다. 연구진은 먼저 사람이 이해할 수 있는 텍스트 형태의 무기 결정 소재 데이터를 범용 LLM에 학습시키는 미세 조정(fine-tuning) 과정을 거쳤습니다. 그리고 가상 특정 물질의 합성 가능 여부를 분류하고, 합성에 필요한 전구체를 예측하는 동시에 합성 가능성 판단에 필요한 인자들을 밝혀내고 해석할 수 있는 모델을 구축했습니다. 그 결과 LLM은 기존의 맞춤형 기계학습 모델을 뛰어넘는 수준의 예측 정확도를 달성할 수 있었습니다.
또한 연구진은 LLM이 단순한 예측 수행에 그치지 않고, 과학자에게 해석 가능한 방식으로 신소재 합성이 가능한 이유를 설명할 수 있다는 점을 발견했습니다. 아직 합성되지 않은 가상의 결정 구조의 합성이 왜 어려운지, 어떤 요소가 합성 가능성을 저해하는지 등에 관해 분석할 수 있는 길이 열린 것입니다. 또한 소재의 합성 가능성에 영향을 주지만, 기존에는 알려지지 않았던 복잡한 상관관계와 요소들을 규명하는 데도 성공했습니다.
이 획기적인 합성 가능성 예측 및 해석 기술은 국내 신소재 산업은 물론이고 반도체, 2차전지 산업의 경쟁력 강화에도 기여할 것으로 기대됩니다. 기존의 신소재 개발 방식은 숱한 시행착오를 거치는 실험 과정을 수반했지만, LLM 기반 예측 기술을 활용하면 소재 설계를 가속화해 소요 시간을 크게 단축할 수 있기 때문입니다.
서울대학교 정유성 교수는 “LLM이 신소재 합성 가능성을 정교하게 예측할 수 있을 뿐 아니라 그 예측 근거를 해석하고, 합성 가능성에 영향을 주는 화학 규칙을 찾아내는 단초를 제공할 수 있다는 사실을 밝혀냈다는 점에 이번 연구의 의미가 있다”면서 “향후 LLM 기반 기술이 발전하면 보다 효율적이고 직관적인 신소재 설계 방향을 제공할 수 있을 것으로 기대된다”고 밝혔습니다.
서울대학교 김성민 박사는 “이 기술은 신소재에 기반한 반도체 소자 및 고효율 배터리 소재 설계에도 적용할 수 있으므로 한국 주도의 첨단 소재 산업이 기술 우위를 계속 유지하고 시장 선점 효과를 누리는 데 이바지할 수 있다”면서 “아울러 향후 상용화될 경우 연구소와 기업이 새로운 물질을 빠르게 발굴하고, 실제 양산 가능성을 평가하는 핵심 도구로 활용될 것으로 전망된다”며 산업과의 접목 가능성을 예측했습니다.
연구진은 향후 신소재 개발의 패러다임 변화를 모색하는 방향으로 기계학습과 재료과학을 융합한 후속 연구를 수행할 계획입니다.
거대언어모델을 활용해 해석 가능한 예측을 제시하는 과정의 모식도 (사진=서울대학교 제공)
임삼진 객원기자 isj2020@kosns.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 강영관 산업2부장이 최종 확인·수정했습니다.
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지