Anthropic 推出 Claude Opus 4.6，具備 100 萬 Token 的上下文視窗與零日偵測功能

AI 安全與推理的新時代：Anthropic 發表 Claude Opus 4.6

2026 年 2 月 6 日 – 在人工智慧（Artificial Intelligence）產業的關鍵時刻，Anthropic 正式發表了 Claude Opus 4.6，這款模型不僅推向了內容留存的極限，更從根本上重塑了 AI 在網路安全（Cybersecurity）中的角色。隨著具備巨大的 100 萬 Token 上下文視窗（context window） 以及展示出自主偵測零日漏洞（zero-day vulnerabilities）的能力，Opus 4.6 為企業級 AI 樹立了新的標竿。

此次發布於今日早些時候向開發者和企業合作夥伴推出，正值競爭激烈的環境。然而，Anthropic 的最新旗艦產品脫穎而出，不僅是透過原始性能指標，更是透過對安全和自主推理的專門關注，這似乎已經超越了現有的競爭對手。透過與 Snowflake Cortex AI 的原生整合，以及在各大雲端供應商的可用性，Opus 4.6 有望成為下一代企業智慧和軟體防禦的中樞。

百萬級 Token 的重大突破

在過去的一年裡，「上下文視窗」——即 AI 在單次互動中可以處理的資訊量——一直是模型開發者的主要戰場。Claude Opus 4.6 透過在 Beta 測試中引入可靠的 100 萬 Token 上下文視窗，有效地結束了這場爭論。透視來看，這種容量允許模型在不丟失忠實度的情況下，對數十萬行程式碼、整個法律文件庫或多年的財務記錄進行理解和推理。

與以往模型在對話延伸時會遭遇「上下文衰減（context rot）」不同，Opus 4.6 採用了一種新穎的 上下文壓縮（Context Compaction） 技術。當接近閾值時，此功能會自動總結並壓縮對話的舊部分，確保模型即使在長時間、多輪的代理式（Agentic）工作流程中也能保持高水準的推理能力。

技術規格與定價

Anthropic 保持了積極的定價策略以推動採用。儘管功能顯著升級，但對於企業案例而言，成本結構仍具競爭力。

Claude Opus 4.6 技術概覽

功能	規格	詳情
上下文視窗	1,000,000 Tokens (Beta)	支援跨龐大數據集的「大海撈針」（Needle-in-a-haystack）檢索
輸出容量	128,000 Tokens	支援生成完整的軟體模組或綜合報告
定價（輸入）	$5.00 / 1M Tokens	標準企業級別
定價（輸出）	$25.00 / 1M Tokens	標準企業級別
推論架構	適應性思考（Adaptive Thinking）	根據查詢複雜度動態調整推理深度
部署	雲端 & API	原生支援 Snowflake Cortex、AWS Bedrock、Google Vertex AI

128k Token 的輸出限制增加對開發者尤為重要。它允許模型在一次執行中編寫廣泛的程式碼補丁或生成長篇分析報告，消除了小輸出限制模型通常需要的碎片化處理。

重新定義網路安全：零日漏洞獵人

此次發布中最令人震驚的揭示或許是 Claude Opus 4.6 在網路安全方面的精通。在內部測試階段，該模型在開源軟體中識別出 500 多個先前未知的零日漏洞。

這種能力代表了從傳統「模糊測試（fuzzing）」技術的範式轉移，後者依賴於用隨機數據轟炸軟體以尋找崩潰。相反地，Opus 4.6 閱讀並推理程式碼架構，就像人類安全研究員一樣。它能識別自動化工具經常遺漏的邏輯不一致、競態條件（race conditions）以及不當的記憶體處理。

對開源安全的影響

自主審計： 該模型可以自主審計複雜的函式庫，而無需專門的提示。
補丁生成： 除偵測外，Opus 4.6 還建議經過人工驗證的補丁，其中許多已在關鍵開源專案中實施。
防禦姿態： Anthropic 將其定位為防禦工具，儘管這種能力的雙重用途性質已在網路安全社群中引發了立即的爭論。

「這不僅僅是一個編碼助手；它是一個數位免疫系統，」Anthropic 的一位首席研究員指出。透過將這些能力直接整合到模型的推理組織中，Anthropic 旨在扭轉日益增加的網路威脅趨勢，有效地允許企業使用驅動其應用程式的相同智慧來保護其基礎設施。

代理能力與編碼優勢

Claude Opus 4.6 被產業分析師譽為「2,000 人的破壞球（wrecking ball）」，這是對其交付能力超越顯著更大規模組織的認可。這種效率源於其先進的代理能力。Claude Code 中新的 代理團隊（Agent Teams） 功能允許開發者啟動多個自主代理，協作解決複雜任務。一個代理可能負責起草架構，另一個編寫測試，第三個則進行程式碼審查——全部由主要的 Opus 4.6 模型編排。

今天早上發布的基準測試證實了這些說法。在 ARC AGI 2 基準測試（一項對通用人工智慧（General Artificial Intelligence）的嚴格測試）中，Opus 4.6 得分為 68.8%，幾乎是其前身性能的兩倍。在法律領域，它在 BigLaw Bench 上達到了驚人的 90.2%，標誌著其已為高風險的專業服務做好準備。

在 GDPval-AA 基準測試（衡量具有經濟價值的知識工作績效）的直接比較中，Opus 4.6 的表現領先 OpenAI 的 GPT-5.2 約 144 Elo 分數。這種領先優勢在需要多步推理和遵循複雜指令的任務中尤為明顯，而在這些領域，「基於感知（vibe-based）」的編碼往往表現不佳。

企業整合：Snowflake 及更多領域

意識到強大的模型需要安全的數據環境，Anthropic 深化了與 Snowflake 的合作。Claude Opus 4.6 現已原生整合於 Snowflake Cortex AI 中。這種整合允許企業直接針對存儲在 Snowflake 中的專有數據運行模型，同時保持嚴格的治理和安全邊界。

對於金融和醫療保健等產業，這種「數據到智慧」的管道至關重要。金融機構現在可以使用 Opus 4.6 分析數百萬條交易記錄以尋找欺詐模式（利用 100 萬上下文視窗），而數據無需離開其受控的 Snowflake 邊界。

該模型也立即透過 Amazon Bedrock、Google Cloud Vertex AI 以及 Microsoft Azure AI Foundry 提供，確保無論採用何種雲端策略，企業都能獲取 Anthropic 的最新能力。

市場影響與前瞻

市場對此次發布的反應迅速。由於投資者消化了 AI 能夠自主執行高階編碼和法律分析的影響，與傳統軟體服務相關的科技股出現波動。相反地，網路安全公司正爭相在其平台中整合類似的「基於推理」的偵測技術。

Anthropic 的「安全執著（Safety Obsession）」策略似乎正在產生回報。透過專注於可靠、可控且安全的模型行為，他們創造了一款讓企業資訊長（CIO）感到放心部署的產品。發現 500 個零日漏洞既是一項功能，也是一次行銷上的勝利——證明了安全研究可以產生強大的實際應用。

隨著開發者在本週末開始探索 100 萬 Token 上下文和代理式工作流程，業界正準備迎接一波先前不可能實現的新應用。從自我修復的程式碼庫到自動化的法律防禦，Claude Opus 4.6 不僅提高了標準，還重寫了生成式 AI（Generative AI）的可能性規則。

免責聲明：本文基於 Anthropic 於 2026 年 2 月 6 日發布的技術規格和新聞資料。性能指標和基準測試分數引用自 Anthropic 的官方技術報告。