麻省理工學院研究人員公布 DiffSyn：加速複雜材料合成的生成式 AI 模型

MIT 研究人員公開 DiffSyn：用於材料合成的生成式 AI（Generative AI）飛躍

在計算材料科學領域的一項里程碑式進展中，麻省理工學院（MIT）的研究人員公佈了「DiffSyn」——一個新穎的生成式 AI 模型，旨在解決科學發現中最持久的瓶頸之一：合成鴻溝。雖然現代計算方法可以預測數百萬具有革命性特性的理論材料，但確定在實驗室中製造它們的精確化學「配方」仍然是一個昂貴且充滿反覆試驗的過程。DiffSyn 改變了這一範式，能在不到一分鐘內提出可行的合成路徑。

這項發表在 Nature Computational Science 的突破，將擴散模型（diffusion models）——與像 DALL-E 等圖像生成器背後相同的技術——的威力，應用到化學工程那個複雜且高維的空間。通過在大量歷史合成配方資料上訓練，DiffSyn 允許科學家以前所未有的速度和準確性，從假設性的材料設計轉向物理原型。

「逆向設計」困境

數十年來，材料科學（materials science）一直受制於一個稱為「逆向設計」的重大制約。科學家可以使用密度泛函理論（DFT）以及其他模擬工具，設計出理論上應該能作為完美電池正極或高效率太陽能吸收層的晶體結構。然而，知道一個材料要由哪些原子組成，與知道如何組裝這些原子，兩者差異甚大。

麻省理工學院材料科學與工程系（DMSE）博士候選人、該研究的第一作者 Elton Pan 以一個易於理解的類比說明這個挑戰：「打個比方，我們知道想做哪種蛋糕，但目前我們還不知道如何烤出那個蛋糕。」

目前，設計與實現之間的鴻溝由領域專家的經驗與大量實驗來彌合。研究者可能花數月時間微調溫度梯度、前驅物比例和加熱時長，才能使單一新化合物穩定下來。這種「愛迪生式（Edisonian）」的方法構成了材料發現流程中最耗時的階段，常常讓創新停滯數年。DiffSyn 的目標是通過成為化學合成的智能導航器，讓這種手動模式退場。

解讀 DiffSyn 架構

DiffSyn 與早期化學領域的 AI 模型不同之處，在於它採用了一種 基於擴散的架構（diffusion-based architecture）。先前的模型可能會將合成預測視為一個簡單的回歸任務，而 DiffSyn 將其視為一個生成過程。

該模型在一個涵蓋超過 23,000 條材料合成配方 的綜合資料集上進行訓練，這些配方來自 50 年的科學文獻。該資料集涵蓋了各式各樣的合成條件，繪製出成功化學反應的豐富圖譜。

訓練過程涉及現代生成式 AI 典型的正向與反向擴散機制：

正向過程（噪聲注入）： 模型以有效的合成配方（溫度、時間、成分）為輸入，並迭代地加入數學「噪聲」，直到資料變為難以辨識的隨機化狀態。
反向過程（去噪/學習）： 模型學會逆轉此過程，從噪聲中預測出原始的結構化配方。

在推論階段，當科學家輸入期望的晶體結構時，DiffSyn 從隨機噪聲開始並逐步「去噪」，受目標材料結構約束所引導。結果是一組結構化且合乎邏輯的指示──一個最有可能產生目標材料的配方。

DiffSyn 的關鍵技術規格

Feature	Specification	Description
Model Architecture	Diffusion Probabilistic Model	Uses iterative denoising to generate synthesis parameters from random noise.
Training Dataset	23,000+ Recipes	Curated from 50 years of scientific literature, focusing on successful synthesis outcomes.
Inference Time	< 60 Seconds	Generates potential synthesis pathways in under a minute, replacing weeks of literature review.
Target Application	Zeolites & Porous Materials	Validated on complex crystal structures used in catalysis and ion exchange.
Output Type	Synthesis Parameters	Provides specific precursors, heating temperatures, dwell times, and molar ratios.

驗證模型：沸石（Zeolites）的突破

為了證明 DiffSyn 在理論基準之外的實用性，MIT 團隊將重點放在 沸石（Zeolites）。沸石是廣泛用作商業吸附劑和催化劑的微孔鋁矽酸鹽礦物。其複雜且類籠的結構使得它們合成極為困難；加工條件的輕微偏差就可能導致完全不同且無用的物相。

研究人員要求 DiffSyn 為一個特定的沸石結構生成配方。模型提出了一條與標準慣例不同的合成路徑，預測了有利於所需晶體形成的特定條件。

根據 DiffSyn 的建議，團隊合成出一種新的沸石材料。物理測試證實，該 AI 生成的配方不僅有效，且所製得的材料在熱穩定性方面比既有版本 更為優異。這一成功成為關鍵的概念驗證：該模型不只是從訓練資料中檢索已知配方，而是將其知識泛化，為複雜材料提出新穎且經過優化的路徑。

在 AI 與實驗室之間架橋

DiffSyn 的影響遠超學術好奇心。透過加速發現過程中的「配方」階段，生成式 AI 有望極大縮短關鍵技術的上市時間。

潔淨能源： 加速固態電池電解質與鈣鈦礦太陽能電池（perovskite solar cells）的開發。
碳捕捉： 快速原型化為捕獲 CO2 設計的金屬有機框架（MOFs）。
半導體： 高效發現用於下一代晶片的新摻雜技術。

Valencia 理工大學的 Manuel Moliner 教授與 MIT 的 Yuriy Roman-Leshkov 教授（論文共同作者）強調，DiffSyn 並非用來取代科學家，而是用來增強他們的能力。透過將無限的化學條件搜尋空間縮小到少數高機率的候選項，該模型讓研究者能把資源集中在最有可能成功的實驗上。

生成化學的未來方向

雖然 DiffSyn 在沸石上展示了最先進的準確性，研究團隊也承認，將其能力擴展到其他材料類別（例如合金或聚合物）將需要更大的資料集。然而，目前的成功驗證了這樣一個假設：最初為藝術與語言打造的擴散模型，具有掌握物理化學定律的數學多樣性。

隨著科學文獻資料庫的不斷擴增，像 DiffSyn 這樣的模型將變得愈加精練。我們正進入一個時代，世界上最先進材料的「烘焙說明」不再鎖在少數專家的直覺中，而是由人工智慧隨需生成。

對 MIT 團隊而言，DiffSyn 的發佈僅是開始。其程式碼與方法論預計將影響新一波的「實驗室回路（lab-in-the-loop）」AI 系統，在這些系統中，生成式模型與機器人自動化結合，24/7 自主地發現、合成並測試材料。