中國AI公司在DeepSeek成功後爭相發布新模型

競爭的新紀元：中國科技巨頭揭曉旗艦模型

在「DeepSeek 衝擊」（DeepSeek Shock）從根本上重塑全球人工智慧格局一年後，中國領先的 AI 實驗室發起了一場協同的大型模型發布攻勢。隨著業界迎來 DeepSeek 在 2025 年春節期間顛覆性進入市場的一週年，包括智譜 AI（Zhipu AI）、月之暗面（Moonshot AI）和字節跳動（ByteDance）在內的巨頭同時揭曉了其下一代基礎模型。本週一系列密集的發布——以智譜 AI 的 GLM-5、月之暗面的 Kimi 2.5 以及字節跳動的 Seedance 2.0 為首——標誌著中國 AI 生態系統已從追趕策略果斷轉向真正的架構創新。

這一時機極具戰略意義，映襯了去年將 DeepSeek 推向全球矚目地位的假期發布窗口。然而，與 2025 年的價格戰不同，2026 年的戰場由「智能體化」（Agentic）能力、影片生成的主導地位，以及可以說是最重要的里程碑：完全的硬體獨立所定義。

智譜 AI 的 GLM-5：實現基礎設施獨立

領銜衝鋒的是智譜 AI，該公司正式發布了 GLM-5，這是一款代表中國運算基礎設施轉折點的大型語言模型。GLM-5 的總參數高達 7,450 億，採用混合專家模型（Mixture-of-Experts, MoE）架構，每次推理啟動 440 億個參數。

使 GLM-5 脫穎而出的不僅是其規模，還有其來源。智譜 AI 證實，該模型完全是在 華為昇騰（Huawei Ascend）晶片上訓練的，這標誌著首次有如此規模的前沿級模型在不依賴受美國限制的 NVIDIA 硬體的情況下開發完成。這項成就解決了長期困擾該行業的「算力差距」焦慮，證明了國產硬體堆疊可以支持訓練與 GPT-5.2 和 Claude Opus 4.5 競爭的模型。

市場反應迅速。在公告發布後，智譜 AI 在香港證券交易所的股價飆升了近 30%。該公司於 2026 年 1 月完成了 IPO，並將 GLM-5 定位為「智能體工程」的基石。與以往專注於聊天的版本不同，GLM-5 針對複雜系統操作和自主編碼進行了優化，據報在邏輯推理和長上下文理解（高達 200,000 個 token）的內部基準測試中表現優於 Google 的 Gemini 3 Pro。

月之暗面的 Kimi 2.5：智能體群落的興起

在智譜 AI 專注於基礎設施和規模的同時，月之暗面通過發布 Kimi 2.5 在智能體化工作流上加倍下注。新模型引入了一項名為「智能體群落」（Agent Swarm）的專有技術，能夠協調多達 100 個並行子智能體來同時執行複雜任務。

Kimi 2.5 採用了一種稱為 並行智能體強化學習（Parallel-Agent Reinforcement Learning, PARL）的新穎訓練方法。這使得模型能夠將單個用戶提示（例如「構建一個全棧電子商務儀表板」）分解為數十個由專業子智能體（例如前端設計、數據庫架構、 API 整合）處理的獨立線程，這些智能體會即時通訊並合併其輸出。

結果令人震驚。月之暗面聲稱，與順序執行模型相比，Kimi 2.5 將複雜多步驟任務的延遲降低了 4.5 倍。該模型還直接整合到了 Microsoft Foundry 平台中，此舉將其影響力擴大到全球企業客戶。在基準測試中，Kimi 2.5 在 AIME 2026 上獲得了 96.1% 的分數，鞏固了其作為數學推理和自動化軟體工程首選模型的地位。

字節跳動的 Seedance 2.0：重新定義 AI 影片製作

在多模態領域，字節跳動揭曉了 Seedance 2.0，這是一款威脅要顛覆電影和廣告行業的生成式影片模型。Seedance 2.0 跨越了早期 AI 影片的「實驗」階段，被市場定位為一款生產級工具，能夠生成 4 到 15 秒、具有電影感 2K 分辨率的片段。

底層架構被描述為「雙分支擴散 Transformer」（Dual Branch Diffusion Transformer），允許同時生成影片和高傳真音訊。這解決了長期阻礙 Sora 和可靈（Kling）等競爭對手的「默片」問題。Seedance 2.0 還引入了對鏡頭移動和角色一致性前所未有的控制。在 Beta 演示中，用戶生成了複雜的「多鏡頭」敘事，角色的外觀在不同光影環境和相機角度下保持像素級的精確一致。

行業分析師指出，利用字節跳動龐大的內部基礎設施，Seedance 2.0 的影片處理速度比最接近的競爭對手快 30%。該發布已在社交媒體平台上病毒式傳播，創作者們展示了與傳統 CGI 幾乎無異的「AI 電影」。

「DeepSeek 效應」與市場動態

這些模型的協同發布與「DeepSeek 效應」（DeepSeek Effect）有著不可分割的聯繫。2025 年初，DeepSeek 發布的高性能、低成本模型擊垮了現有公司的定價權，並迫使創新速度大幅加快。一年後，市場已經成熟。焦點已從單純降低 token 成本轉向增加模型的「智能密度」（Intelligence density）。

投資者對這一戰略轉向給予了回報。在本週資本流入 AI 相關企業的推動下，恒生科技指數大幅上揚。然而，慶祝活動中仍籠罩著一片陰影：即將發布的 DeepSeek V4。傳聞暗示 DeepSeek 的新模型預計將於本月晚些時候推出，可能會再次重設性能基準，特別是在推理任務方面。

下表提供了本週發布的三大模型的技術對比，突顯了中國企業為奪取市場份額所採取的多元化方法。

新發布模型比較分析

功能/指標	智譜 AI GLM-5	月之暗面 Kimi 2.5	字節跳動 Seedance 2.0
主要領域	大型語言模型（邏輯/代碼）	智能體協調與多模態	生成式影片與音訊
架構	混合專家模型（MoE）	並行智能體強化學習（PARL）	雙分支擴散 Transformer
規模/規格	7,450 億參數（440 億激活）	支持 100+ 同步智能體	2K 分辨率，15 秒時長
關鍵創新	100% 在華為昇騰晶片上訓練	用於並行執行的「智能體群落」	原生音影同步與角色一致性
商用可用性	開源權重與 API	Microsoft Foundry 與 API	封閉測試（即夢平台）
基準測試亮點	在編碼方面媲美 GPT-5.2	AIME 2026 得分 96.1%	生成速度比可靈快 30%

前瞻：DeepSeek V4 的期待

儘管這些發布令人印象深刻，但業界仍保持高度警戒。Creati.ai 的消息來源顯示，DeepSeek 正準備在 2 月底前推出其 V4 模型。與轉向影片（字節跳動）或企業智能體（月之暗面）的競爭對手不同，預計 DeepSeek 將繼續專注於純粹的推理能力，可能會為 AI 的「系統 2」思維引入新範式。

然而就目前而言，聚光燈屬於智譜 AI、月之暗面和字節跳動。他們已成功證明，中國 AI 生態系統不再僅由快速追隨定義，而是由獨特的技術哲學所定義——無論是智譜 AI 的硬體主權、月之暗面的智能體群落，還是字節跳動的創意精通。隨著 2026 年的展開，競爭不再僅僅關於誰擁有最大的模型，而是關於誰能最有效地將這些智能整合進全球數位經濟的架構中。