
在計算數學的一個里程碑式進展中,Google DeepMind 宣佈其最新的人工智慧(Artificial Intelligence,AI)系統 Aletheia 已成功解決了著名的艾狄胥(Erdős)系列中的 13 個開放式問題。這項與柏克萊加州大學(UC Berkeley)研究人員合作取得的突破,標誌著 AI 角色的重大轉變——從單純的計算工具演變為理論研究中真正的合作夥伴。
該項目針對多產數學家保羅·艾狄胥(Paul Erdős)提出的 700 多個尚未解決的猜想,展示了將先進的大型語言模型(Large Language Models,LLMs)與嚴謹的人類監督相結合的力量。透過識別新穎的證明、重新發現遺失的解決方案並糾正歷史誤解,Aletheia 為科學領域的人機協作(human-AI synergy)建立了新標準。
與以往重度依賴暴力破解計算或嚴格形式化證明輔助工具的數學 AI 不同,Aletheia 是基於 Google Gemini 架構的專門版本構建的。它採用了一種**「生成器-評論家」(Generator-Critic)**方法論,旨在模擬學術研究中固有的同行評審過程。
該系統透過一個半自治的漏斗運作。首先,「生成器」模組針對形式化的問題陳述提出潛在的證明或反例。隨後,一個獨立的「評論家」模組評估這些提案的邏輯一致性、幻覺以及數學有效性。這種內部的對抗循環使 Aletheia 能夠在錯誤的論點到達人類研究人員之前,先篩選掉聽起來合理但實際上錯誤的內容。
在艾狄胥項目中,該系統處理了約 700 個問題陳述。在這些問題中,它生成了 200 個候選解決方案。經過內部評論階段後,63 個技術上正確的回覆被轉發給人類數學家進行最終驗證。結果是產生了 13 個具有數學意義的解決方案,目前已被社群接受。
Aletheia 的成功不在於取代人類數學家,而在於增強他們的能力。這 13 個被解決的問題揭示了 AI 在研究過程中可以承擔多個不同的角色,從自主發現者到數位檔案館管理員。
這些解決方案被分為四種類型,突顯了系統的多功能性:
Aletheia 的貢獻詳解
| 貢獻類型 | 計數 | 描述 |
|---|---|---|
| 自主發現 | 2 | AI 為數十年來一直未解的問題(如 Erdős-1051)生成了完全新穎的證明。 |
| 文獻識別 | 5 | Aletheia 識別出這些「開放式」問題實際上已在冷門或未數位化的期刊中得到解決,有效地清理了數學記錄。 |
| 獨立重新發現 | 3 | 系統獨立推導出正確的證明,經過深度驗證後,發現與現有的人類解決方案一致。 |
| 部分解決方案 | 3 | AI 成功破解了更大型、更複雜猜想中的特定子組件或特殊案例。 |
此項目最顯著的成就之一是解決了 Erdős-1051,這是一個關於無窮級數性質和馬勒測度(Mahler measure)的問題。數十年來,數學界一直不確定是否能滿足關於級數尾部的特定條件。
Aletheia 提出了一種結合解析數論和組合界限的新穎構造。該證明不僅正確,而且被評審數學家描述為「優雅」且「非平凡」。這個特定實例證明了基於 LLM 的系統可以參與高階創造性推理,處理以前被認為是人類直覺專屬領域的抽象概念。
該項目最令人驚訝的結果,或許是 AI 充當史料編纂者的能力。在 13 個解決方案中,有 5 個案例是該問題在技術上已經被解決,但證明埋藏在尚未被廣泛索引的冷門會議論文集或期刊中。
透過交叉引用海量的數學文獻數據集,Aletheia 能夠將這些問題標記為「已解決」,並引導研究人員找到原始引用。這種能力解決了現代數學中一個日益嚴峻的危機:知識的碎片化。隨著發表的研究量呈指數級增長,AI 綜合歷史並防止重複勞動的能力,變得與生成新證明同樣重要。
Google DeepMind 與學術機構之間的合作,預示著數學研究進行方式的轉型。「人機協同」(human-in-the-loop)模式確保了 AI 的幻覺得到檢查,同時最大限度地發揮機器探索廣闊邏輯搜索空間的能力。
研究人員預計,Aletheia 的未來版本將直接整合到證明輔助軟體中,為工作的數學家提供即時建議和「完整性檢查」。這種演變暗示了一個未來:數學中人類與機器智慧之間的界限變得越來越模糊,從而導致發現速度的快速提升。
隨著 Aletheia 繼續挑戰剩餘的數百個艾狄胥問題,科學界正屏息以待,渴望看到還有哪些「不可能」的謎團會在這強大的新夥伴關係面前迎刃而解。
類別關鍵詞:
標籤關鍵詞: