OpenAI 升級 Responses API，新增代理人技能與完整終端 Shell 支援

OpenAI 透過 Responses API 的重大更新重新定義自主工作流（Autonomous Workflows）

為了鞏固其在代理式 AI（Agentic AI）領域的領先地位，OpenAI 採取了果斷行動，針對其 Responses API 推出了全面升級。昨天宣布的這次發布，引入了代理技能（Agent Skills）、託管 Shell 容器（Hosted Shell Containers）以及伺服器端壓縮（Server-Side Compaction）——這三項功能旨在將 AI 開發從簡單的聊天機器人轉型為強大、且能長期運行的自主代理。

這次更新代表了企業開發者的範式轉移（Paradigm Shift）。透過標準化 AI 模型執行複雜程序的方式，並管理長時間任務的運算開銷，OpenAI 正在直接解決代理式工作流中常見的「脆弱性」。隨著新模型 GPT-5.2 的同步整合，這些工具承諾讓自主代理變得更可靠、更具版本化管理能力且更易於擴展。

新標準：代理技能（Agent Skills）

這次更新的核心是引入了 代理技能（Agent Skills），這是一個用於封裝可重複使用行為的標準化框架。此前，開發者被迫將複雜的程序邏輯「塞進」龐大的系統提示（System Prompts）中，導致上下文膨脹和模型遵循度的不穩定。

代理技能透過允許開發者將指令、腳本和資產（例如 Python 文件或範本）打包進一個由 SKILL.md 清單（Manifest）定位的獨立套件中，解決了這個問題。

根據新文檔，技能（Skill）不僅僅是一個工具定義；它是一個可移植的「能力模組」。當開發者將一項技能附加到 Responses API 時，模型會充當智能編排者。它閱讀技能的清單以了解何時使用它，但僅在觸發特定工作流時，才加載完整的程序上下文並執行相關腳本。

技能框架的主要優勢

模組化： 技能可以獨立於核心應用程式代碼進行版本控制和交付。
上下文效率： 程序指令按需加載，保持主系統提示簡潔。
可重複性： 透過將特定資產（如 CSV 範本或格式化腳本）與指令綑綁，代理能在不同運行中產生一致的輸出。

完整的終端 Shell 支援

為了驅動這些技能，OpenAI 升級了 Responses API，使其具備完整的終端 Shell 支援。開發者現在可以在兩種執行環境之間進行選擇：託管 Shell 容器（Hosted Shell Containers） (container_auto) 和 本地 Shell（Local Shells）。

託管 Shell 對於企業部署尤為重要。它提供了一個安全、沙箱化的環境，模型可以在其中編寫代碼、操作文件並執行多步終端命令，而不會危及主機基礎架構。這有效地為 GPT-5.2 提供了一台可以運作的「電腦」，使其能夠完全在 API 託管的基礎架構內執行數據清理、報告生成或代碼重構等任務。

對於需要訪問內部資源的開發者，本地 Shell 整合允許模型在開發者自己的環境中驅動 Shell，架起了雲端智能與本地數據安全之間的橋樑。

透過伺服器端壓縮解決記憶體瓶頸

這次發布中最重要的技術補充之一是 伺服器端壓縮（Server-Side Compaction）。當代理執行長時間運行的任務時——例如研究一個主題數小時或調試大型代碼庫——對話歷史通常會不斷增長，直到達到模型的上下文窗口限制。

伺服器端壓縮將對話中較舊部分的摘要和截斷過程自動化。與以往開發者必須構建自己的「摘要器」循環的手動實現不同，這項原生功能在後台管理上下文窗口。它確保代理保留先前操作的「要點」，同時為新的推理步驟騰出空間，從而使複雜任務在理論上具備無限的運行時間。

比較：系統提示 vs. 代理技能 vs. 工具

為了理解代理技能在現有生態系統中的定位，我們分析了三種主要導引模型行為方法之間的區別。

表 1：控制機制的戰略用途

功能	系統提示 (System Prompts)	代理技能 (Agent Skills)	工具 (Tools)（函數調用）
主要功能	定義全域角色和限制	執行可重複的多步程序	執行副作用或獲取數據
上下文影響	始終加載（高影響）	按需加載（高效）	加載 Schema；加載結果
版本控制	難以進行細粒度版本管理	可獨立控制版本的套件	透過 API Schemas 進行版本控制
最佳使用場景	安全規則、語氣、「始終開啟」的策略	數據流水線、報告生成、複雜邏輯	數據庫查詢、API 整合、網頁搜索
執行方式	上下文內的指令遵循	透過 Shell 的沙箱執行	外部函數執行

開發者體驗與邁向 GPT-5.2

這次更新與 GPT-5.2 的發布緊密整合，該模型專門針對此類多步推理和工具使用進行了優化。早期基準測試表明，與前代產品相比，GPT-5.2 在執行複雜技能的過程中更不容易「迷失」。

開發者可以立即透過新的 POST /v1/skills 端點開始上傳技能。該 API 支援以 ZIP 壓縮檔形式上傳技能，使得將技能部署整合到現有的 CI/CD 流水線中變得非常容易。

結論

隨著這次發布，OpenAI 正在發出信號，「提示工程」（Prompt Engineering）時代正在演變為「代理工程」（Agent Engineering）。從靜態文本生成到動態、熟練執行的轉變，使企業能夠部署不僅會說話、而且會「實作」的 AI。透過解決沙箱化和記憶體管理的基礎設施挑戰，升級後的 Responses API 消除了構建自主軟體工程師、數據分析師和行政助理所需的繁重工作。

對於正在構建下一代 AI 應用程式的 Creati.ai 讀者來說，訊息很明確：是時候停止編寫提示詞，開始封裝代理技能了。