AI News

Moonshot AI 的 Kimi K2.5 重新定義人工智慧(AI)格局並縮小美中差距

總部位於北京的 Moonshot AI 已正式釋出其最新的基礎模型(foundation model)Kimi K2.5;業界分析師指出,此一發展可能已將美國與中國在人工智慧領域的技術差距縮至歷史上最小的幅度。本週釋出的 Kimi K2.5 是一個開源(open-source)、原生多模態(native multimodal)模型,聲稱在效能上可與領先的專有系統相抗衡——包括 OpenAI 的 GPT 系列與 Google 的 Gemini——同時推理成本僅為其一小部分。

此一釋出標誌著全球 AI 競賽的一個重要里程碑,尤其是在美國為限制中國取得先進運算硬體而實施嚴格出口管制的背景下。透過以優化架構而非單純依賴暴力運算力來交付最先進的效能,Moonshot AI 引發了關於半導體制裁效力及開源人工智慧(人工智慧)未來的重新討論。

原生多模態架構與「Agent Swarm」能力

Kimi K2.5 採用複雜的原生多模態架構,能夠同時在文字、影像與視訊之間進行處理與推理。不同於過去世代需為不同模態採用獨立模組的做法,Kimi K2.5 將這些能力整合到單一系統中,允許視覺理解與文字生成之間無縫切換。

然而,K2.5 釋出中最鮮明的特色是其「Agent Swarm」技術。此能力允許模型並行協調多達 100 個子代理(sub-agents)來解決複雜的多步驟問題。

Kimi K2.5 的主要技術能力:

Feature Description Impact
Agent Swarm(代理群) 以並行方式協調 100 個以上子代理 將複雜任務的執行時間最多縮短 4.5 倍
Native Multimodal(原生多模態) 統一處理文字、影像與視訊 支援高保真視覺推理與從視訊輸入進行程式碼生成
Context Window(上下文視窗) 支援高達 262,000 個詞元(token) 可處理長文件與龐大的程式碼庫
Thinking Mode(思考模式) 強化推理能力以應對邏輯謎題 提升在數學與複雜邏輯基準測試上的表現

根據 Moonshot AI 的技術報告,這種並行執行能力對開發者工作流程而言具有革命性意義。在需要大量工具使用的情境下——例如同時搜尋網頁、撰寫程式碼與偵錯——Agent Swarm 可協調執行多達 1,500 次的工具呼叫。這種「蜂巢式」方法有別於早期具代理性模型常見的線性、順序處理,大幅降低終端使用者的延遲。

基準測試表現:媲美矽谷最佳

在第三方與內部評估中,Kimi K2.5 展現出將其效能與產業內最頂尖的封閉源模型並駕齊驅的指標。該模型在程式碼與代理性任務方面顯示出特別強勁的實力,過去這類領域多由位於美國的實驗室主導。

在 Humanity’s Last Exam(HLE)這項設計用來測試 AI 推理極限的基準測試中,Kimi K2.5 據報告得分與領先的美國專有模型僅相差幾個百分點。此外,在 SWE-Bench Verified 的程式碼評估中,該模型獲得 76.8% 的成績,鞏固了它在軟體工程任務中作為頂級工具的地位。

該模型在視覺任務上也表現出色。在 VideoMMMU 基準測試(評估 AI 對視訊內容的理解與推理能力)中,Kimi K2.5 取得 86.6% 的成績,超越數個既有競爭者。這些結果顯示 Moonshot AI 已成功優化其 Mixture-of-Experts(MoE)架構,以最大化訓練資料的效用,有效繞過在較小硬體叢集上常見的報酬遞減現象。

成本效益悖論

Kimi K2.5 發表中最具顛覆性的一環,是其定價結構。Moonshot AI 積極以其稀疏 Mixture-of-Experts(MoE)架構的效率來壓低價格,意圖壓低西方競爭者的價格。

比較定價結構(每百萬詞元(tokens)):

Model Tier Input Cost Output Cost Cost Differential
Kimi K2.5 $0.60 $2.50 基準
Leading US Proprietary Model ~$2.50 ~$10.00 約 4 倍更昂貴
Previous Gen Open Source $1.00 $3.00 約 1.5 倍更昂貴

註:價格為基於當前匯率與報導 API 成本之近似值。

透過以約為可比美國模型四分之一的成本提供旗艦級智慧,Moonshot AI 將 Kimi K2.5 定位為不僅是研究性成果,而是具有商業可行性的企業部署替代方案。此定價策略對西方以訂閱為本的 AI 公司的商業模式造成極大壓力,後者面臨較高的營運開銷。

挑戰半導體出口管制的效力

Kimi K2.5 的釋出具備更廣泛的地緣政治意涵,尤其是關於美國透過半導體出口管制來限制中國 AI 發展的努力。即便無法取得最新的 NVIDIA 硬體,Moonshot AI(由曾任職於 Google 與 Meta 的研究員 Yang Zhilin 創立)仍成功訓練出前沿級模型。

業界專家指出,這一成就支持了「軟體優化」論點。被迫在受限的運算資源下(例如 NVIDIA H800 或國產替代方案)工作的中國實驗室,大量投入在演算法效率與像 Mixture-of-Experts(MoE)等架構創新。這種做法讓他們能夠用更少的 FLOPs(浮點運算次數)擠出更多智慧。

Brookings Institution 的研究員 Kyle Chan 表示,這次釋出提出了正當的疑問:僅靠硬體限制能否維持長期的戰略優勢?如果演算法上的突破能彌補硬體上的劣勢,美國原本希望拉大的「差距」可能反而正在縮小。

開源策略與生態系擴展

Moonshot AI 已釋出 Kimi K2.5 的權重(weights),採取與其他中國科技巨頭相似的開源策略。此舉加速了該模型的全球採用,開發者可在自有基礎設施上下載並執行,確保資料隱私與客製化。

為支援此一生態系,該公司亦推出了 Kimi Code,一款設計為直接整合進工作流程的開發者工具,類似 GitHub Copilot 或 Cursor。透過將高效能的程式碼模型與專屬工具打包,Moonshot 正積極以開發者社群為目標族群——這是一個對建立長期平台主導地位至關重要的人口統計群體。

隨著 AI 產業消化 Kimi K2.5 的能力,2026 年的敘事正在轉變。原本對美國難以撼動領導地位的假設,正被一個多極且激烈競爭的現實所取代;在這個現實中,效率與架構創新與原始運算能力同等重要。

精選