AI News

代理時代的黎明:阿里巴巴的戰略飛躍

在升級全球人工智慧軍備競賽的果斷行動中,阿里巴巴雲(Alibaba Cloud)正式發布了 Qwen 3.5,這是一個擁有 3970 億參數的巨型模型,旨在將產業從被動的聊天機器人轉型為自主的數位代理。該模型於 2026 年 2 月 16 日發布,代表了根本性的架構轉變,優先考慮「代理式(agentic)」能力——即 AI 在沒有人類持續監督的情況下,跨行動端和桌面端介面獨立規劃、使用工具並執行複雜工作流的能力。

這次發布正值 AI 產業的關鍵時刻。雖然 2025 年的特徵是推理模型的細化,但 2026 年正迅速成為「AI 代理」之年。阿里巴巴的最新力作專門針對這一前沿領域,擁有混合 專家混合(mixture-of-experts) (MoE) 架構,聲稱能提供頂尖性能,同時將推理成本比前代產品降低 60%。透過開源 Qwen 3.5-397B-A17B 模型的權重,阿里巴巴不僅是在發布一款產品,更是試圖為下一代開源權重 AI 開發設定標準。

架構突破:397B/17B 設計

Qwen 3.5 的核心在於純粹規模與運作效率之間複雜的工程折衷。雖然該模型擁有驚人的 3970 億總參數,但它採用了高度稀疏的 MoE 架構,每次前向傳遞僅激活 170 億參數

這個「激活參數」數量是開發者和企業客戶的關鍵指標。它使模型能夠保留萬億級參數系統的百科全書式知識和推理深度,同時保持較小模型的推理速度和成本效益。該架構整合了 Gated DeltaNet 技術——一種線性注意機制——並與傳統的 Transformer 層融合。這種混合方法顯著降低了記憶體頻寬需求,這是大規模部署大型語言模型(LLM)時一直存在的瓶頸。

關鍵架構規格:

規格類別 技術細節 對性能的影響
總參數 3970 億 確保廣泛的知識保留和細微差別
激活參數 170 億 實現高速、低延遲推理
架構類型 混合 MoE + Gated DeltaNet 平衡推理深度與計算效率
上下文窗口 256k (標準版) / 1M (Plus 版) 允許處理海量文件和代碼庫
訓練方法 早期融合多模態 對文本、音訊和視訊的原生理解

這種效率不僅僅是理論上的。阿里巴巴雲(Alibaba Cloud) 報告稱,Qwen 3.5 在處理大規模工作負載方面的能力是之前 Qwen 3-Max-Thinking 模型的 八倍,使其成為即時商業應用的可行引擎,而不僅僅是研究產物。

超越聊天:真正的多模態代理

Qwen 3.5 最顯著的區別在於其對 視覺代理能力(visual agentic capabilities) 的關注。與早期主要作為文本輸入、文本輸出引擎的模型不同,Qwen 3.5 是透過「早期融合(early fusion)」多模態技術進行訓練的。這意味著模型原生處理圖像、視訊和音訊以及文本,而不是依賴可能丟失細微差別的獨立適配器層。

對於「代理時代」,這種原生視覺至關重要。阿里巴巴展示了該模型在智慧型手機和桌面上解釋圖形用戶介面(GUI)的能力。在受控演示中,Qwen 3.5 導航複雜的軟體環境,識別按鈕、閱讀動態螢幕內容並執行多步驟工作流——例如跨三個不同的應用程式預訂旅行或管理供應鏈物流——完全自主完成。

這種能力使 Qwen 3.5 直接與西方競爭對手的專有「使用電腦」代理相抗衡。然而,透過在 開源 AI(open-source AI) 套件(採用 Apache 2.0 許可證)中提供這些功能,阿里巴巴正在降低開發者構建自主機器人流程自動化(RPA)工具和個人助手的門檻。

基準測試未來:新的全球標準?

此次發布立即引發了與美國頂尖模型的比較。阿里巴巴聲稱,在內部基準測試中,Qwen 3.5 在特定視覺相關任務和指令遵循方面優於 GPT-5.2 和 Claude Opus 4.5,儘管據報導在純程式碼挑戰中略遜於專門的編碼模型。

2026 年的競爭形勢非常激烈。就在阿里巴巴宣布的消息前幾天,字節跳動更新了其豆包模型,傳聞 DeepSeek 也在準備對抗性的發布。然而,Qwen 3.5 在「人類最後的考試」(HLE-Verified)基準測試中的表現表明,它的推理成熟度已達到與目前市面上最好的閉源模型相媲美的水平。

競爭格局(預測):

功能 Qwen 3.5 (阿里巴巴) GPT-5.2 (OpenAI) Claude Opus 4.5 (Anthropic)
主要焦點 代理式/行動導向 推理/生成式 安全/長上下文
開源權重 (Apache 2.0)
多模態 原生 (早期融合) 原生 原生
部署成本 低 (17B 激活)
生態系統 阿里巴巴雲/Hugging Face Azure/OpenAI API AWS/Google Cloud

全球 AI 軍備競賽

阿里巴巴激進的開源策略是一把雙面刃,旨在削弱競爭對手。透過免費發布這種水準的 多模態基礎模型(multimodal foundation model),阿里巴巴鼓勵全球開發者社群優化並基於其架構進行構建,有效地將 OpenAI 和 Google 等公司試圖獲利的「智慧」層商品化。

此舉強化了中國在開源模型生態系統中日益增長的影響力。在本次發布之前,Qwen 系列的下載量已超過 2000 萬次,預計 3.5 版本的更新將加速在數據主權和部署成本為主要考量的市場中的採用。該模型支持包括小眾方言在內的 200 多種語言,進一步擴大了其在英語世界之外的吸引力。

開發者生態系統與安全

為了支持這些代理的部署,阿里巴巴同時更新了其 阿里巴巴雲 模型服務平台(Model Studio)並發布了「Qwen Agent」框架。該軟體棧為部署自主代理提供了必要的防護欄,包括「思考模式」標籤,允許開發者在模型採取行動前查看其內部推理過程——這對於金融和醫療保健等企業部門的合規性至關重要。

然而,向 代理式 AI(agentic AI) 的轉變引發了重大的安全問題。一個可以在螢幕上「點擊」和「打字」的模型帶來了僅限文本的聊天機器人所沒有的風險。阿里巴巴強調 Qwen 3.5 包含了強大的安全訓練以防止意外操作,但責任將主要落在開發者身上,需要為這些自主系統實施嚴格的權限結構。

隨著產業消化 Qwen 3.5 的功能,有一件事是明確的:「大型語言模型」的定義正在演變。我們不再僅僅是構建會說話的模型;我們正在構建會行動的模型。憑藉 Qwen 3.5,阿里巴巴已確立其作為這一全新代理現實主要架構師的地位。

精選