AI News

發現的民主化:業餘者利用人工智慧(AI, Artificial Intelligence)破解Erdős的密碼

日期: January 17, 2026
主題: AI in Mathematics, Research Democratization
主要人物: Paul Erdős, Neel Somani, Thomas Bloom

在一項震撼通常封閉的學術數學界的發展中,配備先進人工智慧的業餘愛好者成功地解決了匈牙利傳奇數學家 Paul Erdős 所提出的長期未解數學猜想。這一里程碑由 New Scientist 報導,並由近期經驗證的證明所佐證,標誌著科學發現格局的決定性轉變:高階數學研究的進入門檻不僅被降低——而且已被人工智慧推理代理實際上拆解。

不太可能的解題者

數十年來,Paul Erdős(1996 年逝世)留下的未解問題一直是數學創意的試金石。Erdős 以提出表述看似簡單但證明極具挑戰的問題而聞名,他時常附上小額獎金作為趣味性的誘因。直到最近,這些問題一直是終身教職教授與 Fields 獎得主的專屬領域。

然而,2026 年初的事件顛覆了這種等級制度。在此處定義的業餘數學家(指在純數學傳統教職軌道之外運作的個人)已開始提交針對這些「Erdős 問題」的形式化驗證證明。

最近最突出的一項成功涉及 Erdős Problem #397,這是一個關於中心二項係數的問題,多年來難住了數論學者。這項解答並非來自某個大學系所,而是來自一位使用市面上可取得的模型 GPT-5.2,並配合一個名為 Aristotle 的形式化驗證系統的人士。

人工智慧—人類協作的工作流程

突破不在於人工智慧「神奇地」知道答案,而在於一種將大型語言模型(大型語言模型(LLM, large language model))推理與形式化證明驗證結合的新型工作流程。這種「神經符號(neuro-symbolic)」方法解決了大型語言模型在數學上的歷史性弱點:它們傾向產生看似合理卻不正確的邏輯(即 hallucination)。

這些新潮數學家採用的方法大致遵循三步驟流程:

  1. 概念性推理: 人類使用者提示人工智慧(例如 GPT-5.2 或 Claude)產生證明的高階策略。
  2. 形式化翻譯: 人工智慧將這些策略翻譯成形式化證明語言,例如 Lean 4。
  3. 自動化驗證: 專門的「驗證器」代理(如 Aristotle 系統)編譯程式碼。若程式碼無錯誤地編譯,該證明在數學上即為有效,從而消除了需要數月同行審查以檢查微妙邏輯錯誤的需求。

表格:傳統研究模式 vs. 人工智慧協助的業餘研究模式

Feature Traditional Research Model AI-Assisted Amateur Model
Primary Reasoner Human Specialist Human-AI Hybrid
Verification Method Peer Review (Months/Years) Formal Compiler (Seconds/Minutes)
Barrier to Entry PhD in Mathematics Access to Compute & Logic Skills
Tooling Pen, Paper, LaTeX LLMs, Lean, Python
Success Rate Low (High failure cost) High (Rapid iteration allowed)
--- --- ----

能力上的轉變

這種現象顯示人工智慧推理已趨成熟。就在兩年前,人工智慧模型在基本算術上掙扎,幾乎無法跟隨高中幾何證明的邏輯。如今,系統展現出在抽象數學的「搜尋空間」中導航的能力,其直覺模仿——而在某些情況甚至超越——人類能力。

曼徹斯特大學的數學家 Thomas Bloom 在接受 New Scientist 訪問時指出了這一轉變的意義。他觀察到,雖然目前被解決的 Erdős 問題可能不是該領域的「珠穆朗瑪峰」(例如黎曼猜想),但它們無疑是過去需要大量專業知識才能攀登的「阿爾卑斯山峰」。人工智慧現在能引導非專家抵達這些山峰,意味著科學領域中人工通用智慧(AGI, Artificial General Intelligence)所需的「推理門檻」正被跨越。

「Aristotle」因素

這些近期勝利的一個關鍵成分是專門化系統的出現,如 Aristotle。與通用聊天機器人不同,Aristotle 被專門設計成在自然語言想法與形式邏輯之間介面運作。

當量化研究員 Neel Somani 處理 Erdős Problem #397 時,他並非只是向人工智慧詢問答案。他利用人工智慧搭建直覺與形式化證明嚴格要求之間的橋樑。人工智慧充當一個「超級翻譯器」,將模糊的數學直覺轉換成無可辯駁的程式碼。這項能力允許業餘者專注於問題的「是什麼」與「為何」,而將那令人抓狂的形式語法「如何」交給人工智慧處理。

對科學社群的影響

專業社群的反應在懷疑與驚嘆之間。菲爾茲獎得主 Terence Tao 對這些發展有所參與,並承認由人工智慧系統產生的已驗證證明。

這場民主化帶來機會與挑戰並存:

  • 真理的加速: 累積的未解猜想可能會被快速清理,從而開放被停滯數十年的新數學領域。
  • 「感覺型證明」時代: 有人擔憂數學可能會從理解為何某件事為真,轉為僅僅知道它為真,因為機器驗證了它。然而,像 Lean 這類形式語言的使用實際上有所緩解,因為它強迫達到人類書寫證明常常忽略的嚴謹層次。
  • 公民科學 2.0(Citizen Science 2.0): 就像業餘天文學家發現彗星一樣,我們正在進入一個「公民數學家」的時代,沒有機構隸屬的人也能做出有意義的理論貢獻。

結論:協作智慧的未來

業餘者解決 Erdős 問題不僅僅是一則趣聞;它是知識工作未來的先聲。在 Creati.ai,我們將此視為對協作智慧(協作智慧(Collaborative Intelligence))的終極驗證。人工智慧並未取代人類;它擴大了人類的意圖,填補了盲點與嚴謹上的弱點。

隨著這些工具變得更易取得,我們預期「研究者」的定義將擴大。下一個物理學、生物學或電腦科學上的重大突破,很可能不是出自某個聲望實驗室,而是來自一個好奇心旺盛、手握筆電且有強大人工智慧夥伴的人,一次又一次地透過提示破解宇宙的密碼。

精選