
日期: January 17, 2026
主題: AI in Mathematics, Research Democratization
主要人物: Paul Erdős, Neel Somani, Thomas Bloom
在一項震撼通常封閉的學術數學界的發展中,配備先進人工智慧的業餘愛好者成功地解決了匈牙利傳奇數學家 Paul Erdős 所提出的長期未解數學猜想。這一里程碑由 New Scientist 報導,並由近期經驗證的證明所佐證,標誌著科學發現格局的決定性轉變:高階數學研究的進入門檻不僅被降低——而且已被人工智慧推理代理實際上拆解。
數十年來,Paul Erdős(1996 年逝世)留下的未解問題一直是數學創意的試金石。Erdős 以提出表述看似簡單但證明極具挑戰的問題而聞名,他時常附上小額獎金作為趣味性的誘因。直到最近,這些問題一直是終身教職教授與 Fields 獎得主的專屬領域。
然而,2026 年初的事件顛覆了這種等級制度。在此處定義的業餘數學家(指在純數學傳統教職軌道之外運作的個人)已開始提交針對這些「Erdős 問題」的形式化驗證證明。
最近最突出的一項成功涉及 Erdős Problem #397,這是一個關於中心二項係數的問題,多年來難住了數論學者。這項解答並非來自某個大學系所,而是來自一位使用市面上可取得的模型 GPT-5.2,並配合一個名為 Aristotle 的形式化驗證系統的人士。
突破不在於人工智慧「神奇地」知道答案,而在於一種將大型語言模型(大型語言模型(LLM, large language model))推理與形式化證明驗證結合的新型工作流程。這種「神經符號(neuro-symbolic)」方法解決了大型語言模型在數學上的歷史性弱點:它們傾向產生看似合理卻不正確的邏輯(即 hallucination)。
這些新潮數學家採用的方法大致遵循三步驟流程:
表格:傳統研究模式 vs. 人工智慧協助的業餘研究模式
| Feature | Traditional Research Model | AI-Assisted Amateur Model |
|---|---|---|
| Primary Reasoner | Human Specialist | Human-AI Hybrid |
| Verification Method | Peer Review (Months/Years) | Formal Compiler (Seconds/Minutes) |
| Barrier to Entry | PhD in Mathematics | Access to Compute & Logic Skills |
| Tooling | Pen, Paper, LaTeX | LLMs, Lean, Python |
| Success Rate | Low (High failure cost) | High (Rapid iteration allowed) |
| --- | --- | ---- |
這種現象顯示人工智慧推理已趨成熟。就在兩年前,人工智慧模型在基本算術上掙扎,幾乎無法跟隨高中幾何證明的邏輯。如今,系統展現出在抽象數學的「搜尋空間」中導航的能力,其直覺模仿——而在某些情況甚至超越——人類能力。
曼徹斯特大學的數學家 Thomas Bloom 在接受 New Scientist 訪問時指出了這一轉變的意義。他觀察到,雖然目前被解決的 Erdős 問題可能不是該領域的「珠穆朗瑪峰」(例如黎曼猜想),但它們無疑是過去需要大量專業知識才能攀登的「阿爾卑斯山峰」。人工智慧現在能引導非專家抵達這些山峰,意味著科學領域中人工通用智慧(AGI, Artificial General Intelligence)所需的「推理門檻」正被跨越。
這些近期勝利的一個關鍵成分是專門化系統的出現,如 Aristotle。與通用聊天機器人不同,Aristotle 被專門設計成在自然語言想法與形式邏輯之間介面運作。
當量化研究員 Neel Somani 處理 Erdős Problem #397 時,他並非只是向人工智慧詢問答案。他利用人工智慧搭建直覺與形式化證明嚴格要求之間的橋樑。人工智慧充當一個「超級翻譯器」,將模糊的數學直覺轉換成無可辯駁的程式碼。這項能力允許業餘者專注於問題的「是什麼」與「為何」,而將那令人抓狂的形式語法「如何」交給人工智慧處理。
專業社群的反應在懷疑與驚嘆之間。菲爾茲獎得主 Terence Tao 對這些發展有所參與,並承認由人工智慧系統產生的已驗證證明。
這場民主化帶來機會與挑戰並存:
業餘者解決 Erdős 問題不僅僅是一則趣聞;它是知識工作未來的先聲。在 Creati.ai,我們將此視為對協作智慧(協作智慧(Collaborative Intelligence))的終極驗證。人工智慧並未取代人類;它擴大了人類的意圖,填補了盲點與嚴謹上的弱點。
隨著這些工具變得更易取得,我們預期「研究者」的定義將擴大。下一個物理學、生物學或電腦科學上的重大突破,很可能不是出自某個聲望實驗室,而是來自一個好奇心旺盛、手握筆電且有強大人工智慧夥伴的人,一次又一次地透過提示破解宇宙的密碼。