業餘數學家使用人工智慧解決長期未解的數學問題

發現的民主化：業餘者利用人工智慧（AI, Artificial Intelligence）破解Erdős的密碼

日期： January 17, 2026
主題： AI in Mathematics, Research Democratization
主要人物： Paul Erdős, Neel Somani, Thomas Bloom

在一項震撼通常封閉的學術數學界的發展中，配備先進人工智慧的業餘愛好者成功地解決了匈牙利傳奇數學家 Paul Erdős 所提出的長期未解數學猜想。這一里程碑由 New Scientist 報導，並由近期經驗證的證明所佐證，標誌著科學發現格局的決定性轉變：高階數學研究的進入門檻不僅被降低——而且已被人工智慧推理代理實際上拆解。

不太可能的解題者

數十年來，Paul Erdős（1996 年逝世）留下的未解問題一直是數學創意的試金石。Erdős 以提出表述看似簡單但證明極具挑戰的問題而聞名，他時常附上小額獎金作為趣味性的誘因。直到最近，這些問題一直是終身教職教授與 Fields 獎得主的專屬領域。

然而，2026 年初的事件顛覆了這種等級制度。在此處定義的業餘數學家（指在純數學傳統教職軌道之外運作的個人）已開始提交針對這些「Erdős 問題」的形式化驗證證明。

最近最突出的一項成功涉及 Erdős Problem #397，這是一個關於中心二項係數的問題，多年來難住了數論學者。這項解答並非來自某個大學系所，而是來自一位使用市面上可取得的模型 GPT-5.2，並配合一個名為 Aristotle 的形式化驗證系統的人士。

人工智慧—人類協作的工作流程

突破不在於人工智慧「神奇地」知道答案，而在於一種將大型語言模型（大型語言模型（LLM, large language model））推理與形式化證明驗證結合的新型工作流程。這種「神經符號（neuro-symbolic）」方法解決了大型語言模型在數學上的歷史性弱點：它們傾向產生看似合理卻不正確的邏輯（即 hallucination）。

這些新潮數學家採用的方法大致遵循三步驟流程：

概念性推理： 人類使用者提示人工智慧（例如 GPT-5.2 或 Claude）產生證明的高階策略。
形式化翻譯： 人工智慧將這些策略翻譯成形式化證明語言，例如 Lean 4。
自動化驗證： 專門的「驗證器」代理（如 Aristotle 系統）編譯程式碼。若程式碼無錯誤地編譯，該證明在數學上即為有效，從而消除了需要數月同行審查以檢查微妙邏輯錯誤的需求。

表格：傳統研究模式 vs. 人工智慧協助的業餘研究模式

Feature	Traditional Research Model	AI-Assisted Amateur Model
Primary Reasoner	Human Specialist	Human-AI Hybrid
Verification Method	Peer Review (Months/Years)	Formal Compiler (Seconds/Minutes)
Barrier to Entry	PhD in Mathematics	Access to Compute & Logic Skills
Tooling	Pen, Paper, LaTeX	LLMs, Lean, Python
Success Rate	Low (High failure cost)	High (Rapid iteration allowed)
---	---	----

能力上的轉變

這種現象顯示人工智慧推理已趨成熟。就在兩年前，人工智慧模型在基本算術上掙扎，幾乎無法跟隨高中幾何證明的邏輯。如今，系統展現出在抽象數學的「搜尋空間」中導航的能力，其直覺模仿——而在某些情況甚至超越——人類能力。

曼徹斯特大學的數學家 Thomas Bloom 在接受 New Scientist 訪問時指出了這一轉變的意義。他觀察到，雖然目前被解決的 Erdős 問題可能不是該領域的「珠穆朗瑪峰」（例如黎曼猜想），但它們無疑是過去需要大量專業知識才能攀登的「阿爾卑斯山峰」。人工智慧現在能引導非專家抵達這些山峰，意味著科學領域中人工通用智慧（AGI, Artificial General Intelligence）所需的「推理門檻」正被跨越。

「Aristotle」因素

這些近期勝利的一個關鍵成分是專門化系統的出現，如 Aristotle。與通用聊天機器人不同，Aristotle 被專門設計成在自然語言想法與形式邏輯之間介面運作。

當量化研究員 Neel Somani 處理 Erdős Problem #397 時，他並非只是向人工智慧詢問答案。他利用人工智慧搭建直覺與形式化證明嚴格要求之間的橋樑。人工智慧充當一個「超級翻譯器」，將模糊的數學直覺轉換成無可辯駁的程式碼。這項能力允許業餘者專注於問題的「是什麼」與「為何」，而將那令人抓狂的形式語法「如何」交給人工智慧處理。

對科學社群的影響

專業社群的反應在懷疑與驚嘆之間。菲爾茲獎得主 Terence Tao 對這些發展有所參與，並承認由人工智慧系統產生的已驗證證明。

這場民主化帶來機會與挑戰並存：

真理的加速： 累積的未解猜想可能會被快速清理，從而開放被停滯數十年的新數學領域。
「感覺型證明」時代： 有人擔憂數學可能會從理解為何某件事為真，轉為僅僅知道它為真，因為機器驗證了它。然而，像 Lean 這類形式語言的使用實際上有所緩解，因為它強迫達到人類書寫證明常常忽略的嚴謹層次。
公民科學 2.0（Citizen Science 2.0）： 就像業餘天文學家發現彗星一樣，我們正在進入一個「公民數學家」的時代，沒有機構隸屬的人也能做出有意義的理論貢獻。

結論：協作智慧的未來

業餘者解決 Erdős 問題不僅僅是一則趣聞；它是知識工作未來的先聲。在 Creati.ai，我們將此視為對協作智慧（協作智慧（Collaborative Intelligence））的終極驗證。人工智慧並未取代人類；它擴大了人類的意圖，填補了盲點與嚴謹上的弱點。

隨著這些工具變得更易取得，我們預期「研究者」的定義將擴大。下一個物理學、生物學或電腦科學上的重大突破，很可能不是出自某個聲望實驗室，而是來自一個好奇心旺盛、手握筆電且有強大人工智慧夥伴的人，一次又一次地透過提示破解宇宙的密碼。