AI News

研究的新範式:AI 共同作者時代的曙光

2026 年 2 月 19 日 —— 科學界目前正見證一場歷史學家有朝一日可能會將其與顯微鏡或微積分的發明相提並論的變革。隨著 OpenAI 的 ChatGPT-5 Pro 於 2025 年底發布,全球研究人員已開始報告一系列突破傳統學術發現時間線的深遠突破。本週,這種代理型(Agentic)人工智慧(Artificial Intelligence,AI)的影響體現在兩項里程碑式的成就中:一個解決長期猜想的新數學證明,以及對黑洞熱力學(Black hole thermodynamics)的突破性分析。

在 Creati.ai,我們密切關注大型語言模型(Large Language Models,LLMs)從單純的聊天機器人到推理引擎的發展軌跡。本月的事件證實我們已經跨越了一個門檻。AI 不再僅僅是用於起草摘要或調試代碼的工具;它已晉升為一名能力出眾(儘管仍不完美)的研究夥伴。這一轉變是由 ChatGPT-5 Pro 增強的「思考模式」(Thinking Mode)所驅動的,標誌著代理型科學(Agentic Science)的到來 —— 這是一個由人類直覺與機器精準度合作探索未知的時代。

數學復興:解決不可解之題

ChatGPT-5 Pro 能力最令人矚目的驗證來自純數學領域。本月早些時候,加州大學洛杉磯分校(UCLA)的數學家 Ernest Ryu 發表了一篇論文,詳細介紹了一個困擾研究人員數十年的複雜問題的正式證明。雖然 AI 以前也曾輔助過正式證明,但 Ryu 的案例之所以獨特,是因為模型在「發現」過程中發揮了積極作用。

根據報導,Ryu 利用 ChatGPT-5 Pro 先進的推理能力,不僅僅是檢查他的工作,還用於生成候選引理(lemmas)。該模型在其高運算量的「思考模式」下運行,能夠彌合一個關鍵的邏輯鴻溝,這需要遍歷龐大的潛在論據搜索空間。與以往經常產生聽起來合理但數學上無效步驟的舊版本不同,GPT-5 Pro 展現了持續的思考鏈(Chain of thought),正確識別出一條非直覺的路徑,隨後 Ryu 能夠對其進行驗證和正式化。

這一成功凸顯了模型架構的根本升級。它不僅僅是在檢索資訊;它正在模擬一種數學直覺,提出人類專家隨後可以進行嚴格測試的結構性聯繫。

解碼宇宙:黑洞與數據綜合

雖然數學受益於模型的邏輯嚴謹性,但天體物理學則在利用其綜合海量數據集的能力。以黑洞成像工作聞名的理論物理學家 Alex Lupsasca,將一項關於黑洞光子環結構重大發現的加速歸功於 ChatGPT-5 Pro。

Lupsasca 的團隊使用 AI 來分析干涉測量數據(Interferometric data),這項任務通常需要定制算法和數月的技術手動調整。然而,該模型能夠自適應地編寫並執行自己的數據分析腳本,從雜訊中識別出微妙的相關性,從而提出了一種用於測量黑洞自旋的新觀測特徵。這種「強化版的代碼解釋器」方法使物理學機能夠即時迭代假設,有效地將多年的數據分析壓縮到數週內。

對天體物理學的影響是巨大的。如果 AI 可以自主地充當數據科學家,理論物理學家就可以完全專注於對宇宙的概念性解釋,而將繁重的計算工作交給他們的數位夥伴。

世代對比:邁向代理型科學的跨越

為了理解這一轉變的規模,對比當前最先進模型與上一代 AI 工具的能力會很有幫助。從 GPT-4o 到 GPT-5 Pro 的過渡代表了從被動輔助到主動參與的轉變。

表 1:AI 在科學研究中的演進

功能 傳統 AI(GPT-4 時代) 代理型 AI(GPT-5 Pro 時代)
推理深度 僅限於單次對話的提示詞上下文 自主多步推理(「思考模式」)
幻覺率 較高(在複雜任務中約為 12.9%) 顯著降低(在「思考模式」下約為 4.5%)
研究角色 被動助手(起草、基礎代碼) 主動共同科學家(假設生成、嚴格驗證)
問題解決 需要明確、逐步的人類指導 自我修正的遞迴問題解決
數據分析 對提供的片段進行靜態解讀 在原始數據上動態執行分析流水線

應對「黑箱」與幻覺

儘管取得了這些勝利,但將 ChatGPT-5 Pro 整合到嚴肅科學中並非沒有危險。懷疑精神仍然是科學方法的重要組成部分,且理由充分。雖然與 GPT-4 時代相比,幻覺率(Hallucination rate)已顯著下降,但並未消失。「思考模式」下 4.5% 的錯誤率帶來了獨特的風險:現在的錯誤更加微妙、更具說服力,且比過去顯而易見的錯誤更難檢測。

批評者認為,依賴於一個神經網路內部邏輯不透明的「黑箱」(Black box)系統,違背了科學的可重複性原則。如果 AI 基於無法完全解釋的內部模式匹配過程生成假設,我們能信任它嗎?

來自學術界(包括麻省理工學院 MIT 和國家科學院的聲音)達成的共識是「經核實的信任」。像 Ryu 和 Lupsasca 這樣的研究人員並非盲目接受 AI 的輸出;他們利用 AI 找到了門,但他們親自穿過了門,用嚴謹的傳統方法驗證了每一步。AI 充當可能性的生成器,而非真理的仲裁者。

發現的未來:諾貝爾圖靈挑戰賽

展望未來,2026 年 2 月的成就可能被視為「諾貝爾圖靈挑戰賽」(Nobel Turing Challenge)的開端 —— 該提案旨在 2050 年前創建一個能夠做出足以獲得諾貝爾獎發現的 AI 系統。有了 ChatGPT-5 Pro,我們甚至可能提前完成任務。

這種能力的普及化同樣值得關注。Ryu 和 Lupsasca 使用的工具可供較小型機構的研究人員使用,這可能會平衡競爭環境,並允許出現以前因資金和資源獲取受限而受阻的多樣化思想。

在 Creati.ai,我們相信我們正在進入混合智能(Hybrid intelligence)的黃金時代。未來的科學家將不僅是其領域的大師,更是編排的大師 —— 指揮 AI 代理的交響樂,以以前難以想像的速度探索知識的前沿。人類大腦仍然是建築師,但我們可用的工具剛剛變得無限強大。

精選