
為了鞏固其在代理式 AI(Agentic AI)領域的領先地位,OpenAI 採取了果斷行動,針對其 Responses API 推出了全面升級。昨天宣布的這次發布,引入了代理技能(Agent Skills)、託管 Shell 容器(Hosted Shell Containers)以及伺服器端壓縮(Server-Side Compaction)——這三項功能旨在將 AI 開發從簡單的聊天機器人轉型為強大、且能長期運行的自主代理。
這次更新代表了企業開發者的範式轉移(Paradigm Shift)。透過標準化 AI 模型執行複雜程序的方式,並管理長時間任務的運算開銷,OpenAI 正在直接解決代理式工作流中常見的「脆弱性」。隨著新模型 GPT-5.2 的同步整合,這些工具承諾讓自主代理變得更可靠、更具版本化管理能力且更易於擴展。
這次更新的核心是引入了 代理技能(Agent Skills),這是一個用於封裝可重複使用行為的標準化框架。此前,開發者被迫將複雜的程序邏輯「塞進」龐大的系統提示(System Prompts)中,導致上下文膨脹和模型遵循度的不穩定。
代理技能透過允許開發者將指令、腳本和資產(例如 Python 文件或範本)打包進一個由 SKILL.md 清單(Manifest)定位的獨立套件中,解決了這個問題。
根據新文檔,技能(Skill)不僅僅是一個工具定義;它是一個可移植的「能力模組」。當開發者將一項技能附加到 Responses API 時,模型會充當智能編排者。它閱讀技能的清單以了解何時使用它,但僅在觸發特定工作流時,才加載完整的程序上下文並執行相關腳本。
為了驅動這些技能,OpenAI 升級了 Responses API,使其具備完整的終端 Shell 支援。開發者現在可以在兩種執行環境之間進行選擇:託管 Shell 容器(Hosted Shell Containers) (container_auto) 和 本地 Shell(Local Shells)。
託管 Shell 對於企業部署尤為重要。它提供了一個安全、沙箱化的環境,模型可以在其中編寫代碼、操作文件並執行多步終端命令,而不會危及主機基礎架構。這有效地為 GPT-5.2 提供了一台可以運作的「電腦」,使其能夠完全在 API 託管的基礎架構內執行數據清理、報告生成或代碼重構等任務。
對於需要訪問內部資源的開發者,本地 Shell 整合允許模型在開發者自己的環境中驅動 Shell,架起了雲端智能與本地數據安全之間的橋樑。
這次發布中最重要的技術補充之一是 伺服器端壓縮(Server-Side Compaction)。當代理執行長時間運行的任務時——例如研究一個主題數小時或調試大型代碼庫——對話歷史通常會不斷增長,直到達到模型的上下文窗口限制。
伺服器端壓縮將對話中較舊部分的摘要和截斷過程自動化。與以往開發者必須構建自己的「摘要器」循環的手動實現不同,這項原生功能在後台管理上下文窗口。它確保代理保留先前操作的「要點」,同時為新的推理步驟騰出空間,從而使複雜任務在理論上具備無限的運行時間。
為了理解代理技能在現有生態系統中的定位,我們分析了三種主要導引模型行為方法之間的區別。
表 1:控制機制的戰略用途
| 功能 | 系統提示 (System Prompts) | 代理技能 (Agent Skills) | 工具 (Tools)(函數調用) |
|---|---|---|---|
| 主要功能 | 定義全域角色和限制 | 執行可重複的多步程序 | 執行副作用或獲取數據 |
| 上下文影響 | 始終加載(高影響) | 按需加載(高效) | 加載 Schema;加載結果 |
| 版本控制 | 難以進行細粒度版本管理 | 可獨立控制版本的套件 | 透過 API Schemas 進行版本控制 |
| 最佳使用場景 | 安全規則、語氣、「始終開啟」的策略 | 數據流水線、報告生成、複雜邏輯 | 數據庫查詢、API 整合、網頁搜索 |
| 執行方式 | 上下文內的指令遵循 | 透過 Shell 的沙箱執行 | 外部函數執行 |
這次更新與 GPT-5.2 的發布緊密整合,該模型專門針對此類多步推理和工具使用進行了優化。早期基準測試表明,與前代產品相比,GPT-5.2 在執行複雜技能的過程中更不容易「迷失」。
開發者可以立即透過新的 POST /v1/skills 端點開始上傳技能。該 API 支援以 ZIP 壓縮檔形式上傳技能,使得將技能部署整合到現有的 CI/CD 流水線中變得非常容易。
隨著這次發布,OpenAI 正在發出信號,「提示工程」(Prompt Engineering)時代正在演變為「代理工程」(Agent Engineering)。從靜態文本生成到動態、熟練執行的轉變,使企業能夠部署不僅會說話、而且會「實作」的 AI。透過解決沙箱化和記憶體管理的基礎設施挑戰,升級後的 Responses API 消除了構建自主軟體工程師、數據分析師和行政助理所需的繁重工作。
對於正在構建下一代 AI 應用程式的 Creati.ai 讀者來說,訊息很明確:是時候停止編寫提示詞,開始封裝代理技能了。