
계산 재료 과학 분야의 획기적인 발전으로, 매사추세츠 공과대학(MIT) 연구진이 합성 갭(synthesis gap)이라는 과학적 발견의 지속적인 병목 현상을 해결하도록 설계된 새로운 생성형 모델인 "DiffSyn"을 공개했다. 현대의 계산 방법은 혁신적 특성을 지닌 수백만 개의 이론적 재료를 예측할 수 있지만, 이를 실험실에서 만들기 위한 정확한 화학적 "레시피"를 결정하는 일은 여전히 비용이 많이 드는 시행착오 과정으로 남아 있었다. DiffSyn은 1분 이내에 실행 가능한 합성 경로를 제안함으로써 이 패러다임을 바꾼다.
이 성과는 Nature Computational Science에 게재되었으며, 확산 모델(diffusion models) — DALL-E 같은 이미지 생성기의 배후 기술과 동일한 — 의 힘을 화학공학의 복잡하고 고차원적인 공간에 적용한 것이다. 방대한 분량의 과거 합성 레시피 데이터셋으로 학습한 DiffSyn은 과학자들이 가설적 재료 설계에서 물리적 프로토타입으로 전환하는 속도와 정확도를 전례 없이 높여준다.
수십 년 동안 재료과학(materials science)은 "역설계" 문제로 알려진 중요한 제약 하에 운영되어 왔다. 과학자들은 밀도 범함수 이론(density functional theory, DFT) 및 기타 시뮬레이션 도구를 사용해 이론적으로 완벽한 배터리 양극재나 고효율 태양 흡수체로 기능해야 할 결정 구조를 설계할 수 있다. 그러나 어떤 원자가 재료에 들어가는지를 아는 것과 그것들을 어떻게 조립하는지를 아는 것은 전혀 다른 문제다.
MIT 재료과학공학과(DMSE)의 박사과정생이자 본 연구의 제1저자인 Elton Pan은 이 문제를 이렇게 설명한다. "비유를 들자면, 우리는 어떤 종류의 케이크를 만들고 싶은지는 알지만, 지금은 그 케이크를 어떻게 구워야 할지 모른다."
현재 설계와 실현 사이의 간극은 인간의 도메인 전문지식과 방대한 실험으로 메워진다. 연구자는 단일 신규 화합물을 안정화시키기 위해 수개월을 소비하며 온도 구배, 전구체 비율, 가열 시간 등을 조정할 수 있다. 이러한 'Edisonian' 접근법은 재료 발견 파이프라인에서 가장 오래 걸리는 단계로, 종종 수년간 혁신을 정체시킨다. DiffSyn은 화학 합성의 지능형 내비게이터 역할을 하여 이러한 수작업 패러다임을 종식시키는 것을 목표로 한다.
DiffSyn은 확산 기반 아키텍처를 활용함으로써 기존의 화학 AI 모델과 차별화된다. 이전의 모델들이 합성 예측을 단순 회귀(regression) 과제로 다룰 수 있었던 반면, DiffSyn은 이를 생성적 프로세스로 취급한다.
이 모델은 50년간의 과학 문헌에서 추출한 23,000개 이상의 재료 합성 레시피로 구성된 포괄적인 데이터셋으로 학습되었다. 이 데이터셋은 다양한 합성 조건을 망라하여 성공적인 화학 반응이 어떤 모습인지에 대한 풍부한 지도를 생성한다.
학습 과정은 현대의 생성형 AI에서 전형적인 순방향 및 역방향 확산 메커니즘을 포함한다:
추론 시, 과학자가 원하는 결정 구조를 입력하면 DiffSyn은 무작위 노이즈로 시작해 목표 재료의 구조적 제약에 의해 안내되며 점진적으로 "디노이징"을 수행한다. 그 결과는 구조화되고 논리적인 지침 집합—즉 목표 재료를 얻을 가능성이 높은 레시피—이다.
DiffSyn의 핵심 기술 사양
| 특징 | 사양 | 설명 |
|---|---|---|
| 모델 아키텍처 | 확산 확률 모델 | 무작위 노이즈로부터 합성 파라미터를 생성하기 위해 반복적인 디노이징을 사용함. |
| 학습 데이터셋 | 23,000+ 레시피 | 50년간의 과학 문헌에서 선별한 성공적 합성 결과에 중점. |
| 추론 시간 | < 60초 | 문헌 검토에 수주일 걸리던 합성 경로를 1분 이내에 생성. |
| 대상 응용 | 제올라이트(zeolites) 및 다공성 물질 | 촉매 및 이온 교환에 사용되는 복잡한 결정 구조에서 검증됨. |
| 출력 유형 | 합성 파라미터 | 구체적인 전구체, 가열 온도, 유지 시간, 몰 비율 등을 제공. |
DiffSyn의 유용성을 이론적 벤치마크를 넘어 검증하기 위해 MIT 팀은 제올라이트에 주목했다. 제올라이트는 상업용 흡착제 및 촉매로 널리 사용되는 미세다공성 알루미노실리케이트 광물이다. 그들의 복잡한 케이지형 구조는 합성을 매우 어렵게 만들며, 가공 조건의 작은 변동만으로도 완전히 다른, 쓸모없는 상(相)이 생성될 수 있다.
연구진은 특정 제올라이트 구조에 대한 레시피를 생성하도록 DiffSyn에 과제를 부여했다. 모델은 표준 관습과 다른 합성 경로를 제안하며, 원하는 결정 형성을 촉진할 특정 조건을 예측했다.
DiffSyn의 지침을 따라 팀은 새로운 제올라이트 물질을 합성했다. 물리적 테스트 결과, AI가 생성한 레시피는 단지 작동하는 것뿐만 아니라 기존 반복체보다 열적 안정성 향상을 보이는 물질을 생산했다. 이 성공은 중요한 개념 증명을 제공한다. 즉, 모델이 단순히 학습 데이터에서 알려진 레시피를 검색한 것이 아니라, 복잡한 물질에 대해 새롭고 최적화된 경로를 일반화하여 제안했다는 점이다.
DiffSyn의 영향은 학문적 호기심을 훨씬 넘어선다. "레시피" 단계의 발견을 가속화함으로써 생성형 AI는 핵심 기술의 시장 출시 시간을 획기적으로 단축할 수 있다.
Valencia Polytechnic University의 교수 Manuel Moliner와 MIT 교수 Yuriy Roman-Leshkov(공저자)는 DiffSyn이 과학자를 대체하려는 것이 아니라 그들의 능력을 보강하려는 것이라고 강조한다. 무한한 화학 조건 탐색 공간을 몇 가지 높은 확률의 후보로 좁혀줌으로써, 모델은 연구자들이 성공할 가능성이 높은 실험에 자원을 집중하도록 한다.
DiffSyn이 제올라이트에 대해 최첨단 정확도를 입증했지만, 합금이나 폴리머와 같은 다른 물질 계층으로 기능을 확장하려면 훨씬 더 큰 데이터셋이 필요하다는 것을 연구팀도 인정한다. 그러나 현재의 성공은 원래 예술과 언어를 위해 구축된 확산 모델이 물리 화학의 법칙을 숙달할 수 있는 수학적 다재다능성을 갖고 있다는 가설을 검증한다.
과학 문헌 데이터베이스가 계속해서 성장함에 따라 DiffSyn와 같은 모델은 점점 더 정교해질 것이다. 우리는 세계에서 가장 진보된 재료의 "베이킹 지침"이 더 이상 소수 전문가의 직관에만 잠겨 있지 않고, 필요 시 인공 지능에 의해 생성되는 시대에 접어들고 있다.
MIT 팀에게 DiffSyn의 공개는 시작에 불과하다. 코드와 방법론은 생성 모델과 로봇 자동화가 결합되어 24시간 자율적으로 재료를 발견하고 합성하며 테스트하는 새로운 물류의 "랩 인 더 루프(lab-in-the-loop)" AI 시스템 물결에 영향을 미칠 것으로 기대된다.