
在「DeepSeek 衝擊」(DeepSeek Shock)從根本上重塑全球人工智慧格局一年後,中國領先的 AI 實驗室發起了一場協同的大型模型發布攻勢。隨著業界迎來 DeepSeek 在 2025 年春節期間顛覆性進入市場的一週年,包括智譜 AI(Zhipu AI)、月之暗面(Moonshot AI)和字節跳動(ByteDance)在內的巨頭同時揭曉了其下一代基礎模型。本週一系列密集的發布——以智譜 AI 的 GLM-5、月之暗面的 Kimi 2.5 以及 字節跳動 的 Seedance 2.0 為首——標誌著中國 AI 生態系統已從追趕策略果斷轉向真正的架構創新。
這一時機極具戰略意義,映襯了去年將 DeepSeek 推向全球矚目地位的假期發布窗口。然而,與 2025 年的價格戰不同,2026 年的戰場由「智能體化」(Agentic)能力、影片生成的主導地位,以及可以說是最重要的里程碑:完全的硬體獨立所定義。
領銜衝鋒的是 智譜 AI,該公司正式發布了 GLM-5,這是一款代表中國運算基礎設施轉折點的大型語言模型。GLM-5 的總參數高達 7,450 億,採用混合專家模型(Mixture-of-Experts, MoE)架構,每次推理啟動 440 億個參數。
使 GLM-5 脫穎而出的不僅是其規模,還有其來源。智譜 AI 證實,該模型完全是在 華為昇騰(Huawei Ascend)晶片上訓練的,這標誌著首次有如此規模的前沿級模型在不依賴受美國限制的 NVIDIA 硬體的情況下開發完成。這項成就解決了長期困擾該行業的「算力差距」焦慮,證明了國產硬體堆疊可以支持訓練與 GPT-5.2 和 Claude Opus 4.5 競爭的模型。
市場反應迅速。在公告發布後,智譜 AI 在香港證券交易所的股價飆升了近 30%。該公司於 2026 年 1 月完成了 IPO,並將 GLM-5 定位為「智能體工程」的基石。與以往專注於聊天的版本不同,GLM-5 針對複雜系統操作和自主編碼進行了優化,據報在邏輯推理和長上下文理解(高達 200,000 個 token)的內部基準測試中表現優於 Google 的 Gemini 3 Pro。
在智譜 AI 專注於基礎設施和規模的同時,月之暗面 通過發布 Kimi 2.5 在智能體化工作流上加倍下注。新模型引入了一項名為「智能體群落」(Agent Swarm)的專有技術,能夠協調多達 100 個並行子智能體來同時執行複雜任務。
Kimi 2.5 採用了一種稱為 並行智能體強化學習(Parallel-Agent Reinforcement Learning, PARL)的新穎訓練方法。這使得模型能夠將單個用戶提示(例如「構建一個全棧電子商務儀表板」)分解為數十個由專業子智能體(例如前端設計、數據庫架構、 API 整合)處理的獨立線程,這些智能體會即時通訊並合併其輸出。
結果令人震驚。月之暗面聲稱,與順序執行模型相比,Kimi 2.5 將複雜多步驟任務的延遲降低了 4.5 倍。該模型還直接整合到了 Microsoft Foundry 平台中,此舉將其影響力擴大到全球企業客戶。在基準測試中,Kimi 2.5 在 AIME 2026 上獲得了 96.1% 的分數,鞏固了其作為數學推理和自動化軟體工程首選模型的地位。
在多模態領域,字節跳動揭曉了 Seedance 2.0,這是一款威脅要顛覆電影和廣告行業的生成式影片模型。Seedance 2.0 跨越了早期 AI 影片的「實驗」階段,被市場定位為一款生產級工具,能夠生成 4 到 15 秒、具有電影感 2K 分辨率的片段。
底層架構被描述為「雙分支擴散 Transformer」(Dual Branch Diffusion Transformer),允許同時生成影片和高傳真音訊。這解決了長期阻礙 Sora 和可靈(Kling)等競爭對手的「默片」問題。Seedance 2.0 還引入了對鏡頭移動和角色一致性前所未有的控制。在 Beta 演示中,用戶生成了複雜的「多鏡頭」敘事,角色的外觀在不同光影環境和相機角度下保持像素級的精確一致。
行業分析師指出,利用字節跳動龐大的內部基礎設施,Seedance 2.0 的影片處理速度比最接近的競爭對手快 30%。該發布已在社交媒體平台上病毒式傳播,創作者們展示了與傳統 CGI 幾乎無異的「AI 電影」。
這些模型的協同發布與「DeepSeek 效應」(DeepSeek Effect)有著不可分割的聯繫。2025 年初,DeepSeek 發布的高性能、低成本模型擊垮了現有公司的定價權,並迫使創新速度大幅加快。一年後,市場已經成熟。焦點已從單純降低 token 成本轉向增加模型的「智能密度」(Intelligence density)。
投資者對這一戰略轉向給予了回報。在本週資本流入 AI 相關企業的推動下,恒生科技指數大幅上揚。然而,慶祝活動中仍籠罩著一片陰影:即將發布的 DeepSeek V4。傳聞暗示 DeepSeek 的新模型預計將於本月晚些時候推出,可能會再次重設性能基準,特別是在推理任務方面。
下表提供了本週發布的三大模型的技術對比,突顯了中國企業為奪取市場份額所採取的多元化方法。
| 功能/指標 | 智譜 AI GLM-5 | 月之暗面 Kimi 2.5 | 字節跳動 Seedance 2.0 |
|---|---|---|---|
| 主要領域 | 大型語言模型(邏輯/代碼) | 智能體協調與多模態 | 生成式影片與音訊 |
| 架構 | 混合專家模型(MoE) | 並行智能體強化學習(PARL) | 雙分支擴散 Transformer |
| 規模/規格 | 7,450 億參數(440 億激活) | 支持 100+ 同步智能體 | 2K 分辨率,15 秒時長 |
| 關鍵創新 | 100% 在 華為昇騰 晶片上訓練 | 用於並行執行的「智能體群落」 | 原生音影同步與角色一致性 |
| 商用可用性 | 開源權重與 API | Microsoft Foundry 與 API | 封閉測試(即夢平台) |
| 基準測試亮點 | 在編碼方面媲美 GPT-5.2 | AIME 2026 得分 96.1% | 生成速度比可靈快 30% |
儘管這些發布令人印象深刻,但業界仍保持高度警戒。Creati.ai 的消息來源顯示,DeepSeek 正準備在 2 月底前推出其 V4 模型。與轉向影片(字節跳動)或企業智能體(月之暗面)的競爭對手不同,預計 DeepSeek 將繼續專注於純粹的推理能力,可能會為 AI 的「系統 2」思維引入新範式。
然而就目前而言,聚光燈屬於智譜 AI、月之暗面和字節跳動。他們已成功證明,中國 AI 生態系統不再僅由快速追隨定義,而是由獨特的技術哲學所定義——無論是智譜 AI 的硬體主權、月之暗面的智能體群落,還是字節跳動的創意精通。隨著 2026 年的展開,競爭不再僅僅關於誰擁有最大的模型,而是關於誰能最有效地將這些智能整合進全球數位經濟的架構中。