AI News

OpenAI 透過 Responses API 的重大更新重新定義自主工作流(Autonomous Workflows)

為了鞏固其在代理式 AI(Agentic AI)領域的領先地位,OpenAI 採取了果斷行動,針對其 Responses API 推出了全面升級。昨天宣布的這次發布,引入了代理技能(Agent Skills)託管 Shell 容器(Hosted Shell Containers)以及伺服器端壓縮(Server-Side Compaction)——這三項功能旨在將 AI 開發從簡單的聊天機器人轉型為強大、且能長期運行的自主代理。

這次更新代表了企業開發者的範式轉移(Paradigm Shift)。透過標準化 AI 模型執行複雜程序的方式,並管理長時間任務的運算開銷,OpenAI 正在直接解決代理式工作流中常見的「脆弱性」。隨著新模型 GPT-5.2 的同步整合,這些工具承諾讓自主代理變得更可靠、更具版本化管理能力且更易於擴展。

新標準:代理技能(Agent Skills)

這次更新的核心是引入了 代理技能(Agent Skills),這是一個用於封裝可重複使用行為的標準化框架。此前,開發者被迫將複雜的程序邏輯「塞進」龐大的系統提示(System Prompts)中,導致上下文膨脹和模型遵循度的不穩定。

代理技能透過允許開發者將指令、腳本和資產(例如 Python 文件或範本)打包進一個由 SKILL.md 清單(Manifest)定位的獨立套件中,解決了這個問題。

根據新文檔,技能(Skill)不僅僅是一個工具定義;它是一個可移植的「能力模組」。當開發者將一項技能附加到 Responses API 時,模型會充當智能編排者。它閱讀技能的清單以了解何時使用它,但僅在觸發特定工作流時,才加載完整的程序上下文並執行相關腳本。

技能框架的主要優勢

  • 模組化: 技能可以獨立於核心應用程式代碼進行版本控制和交付。
  • 上下文效率: 程序指令按需加載,保持主系統提示簡潔。
  • 可重複性: 透過將特定資產(如 CSV 範本或格式化腳本)與指令綑綁,代理能在不同運行中產生一致的輸出。

完整的終端 Shell 支援

為了驅動這些技能,OpenAI 升級了 Responses API,使其具備完整的終端 Shell 支援。開發者現在可以在兩種執行環境之間進行選擇:託管 Shell 容器(Hosted Shell Containers) (container_auto) 和 本地 Shell(Local Shells)

託管 Shell 對於企業部署尤為重要。它提供了一個安全、沙箱化的環境,模型可以在其中編寫代碼、操作文件並執行多步終端命令,而不會危及主機基礎架構。這有效地為 GPT-5.2 提供了一台可以運作的「電腦」,使其能夠完全在 API 託管的基礎架構內執行數據清理、報告生成或代碼重構等任務。

對於需要訪問內部資源的開發者,本地 Shell 整合允許模型在開發者自己的環境中驅動 Shell,架起了雲端智能與本地數據安全之間的橋樑。

透過伺服器端壓縮解決記憶體瓶頸

這次發布中最重要的技術補充之一是 伺服器端壓縮(Server-Side Compaction)。當代理執行長時間運行的任務時——例如研究一個主題數小時或調試大型代碼庫——對話歷史通常會不斷增長,直到達到模型的上下文窗口限制。

伺服器端壓縮將對話中較舊部分的摘要和截斷過程自動化。與以往開發者必須構建自己的「摘要器」循環的手動實現不同,這項原生功能在後台管理上下文窗口。它確保代理保留先前操作的「要點」,同時為新的推理步驟騰出空間,從而使複雜任務在理論上具備無限的運行時間。

比較:系統提示 vs. 代理技能 vs. 工具

為了理解代理技能在現有生態系統中的定位,我們分析了三種主要導引模型行為方法之間的區別。

表 1:控制機制的戰略用途

功能 系統提示 (System Prompts) 代理技能 (Agent Skills) 工具 (Tools)(函數調用)
主要功能 定義全域角色和限制 執行可重複的多步程序 執行副作用或獲取數據
上下文影響 始終加載(高影響) 按需加載(高效) 加載 Schema;加載結果
版本控制 難以進行細粒度版本管理 可獨立控制版本的套件 透過 API Schemas 進行版本控制
最佳使用場景 安全規則、語氣、「始終開啟」的策略 數據流水線、報告生成、複雜邏輯 數據庫查詢、API 整合、網頁搜索
執行方式 上下文內的指令遵循 透過 Shell 的沙箱執行 外部函數執行

開發者體驗與邁向 GPT-5.2

這次更新與 GPT-5.2 的發布緊密整合,該模型專門針對此類多步推理和工具使用進行了優化。早期基準測試表明,與前代產品相比,GPT-5.2 在執行複雜技能的過程中更不容易「迷失」。

開發者可以立即透過新的 POST /v1/skills 端點開始上傳技能。該 API 支援以 ZIP 壓縮檔形式上傳技能,使得將技能部署整合到現有的 CI/CD 流水線中變得非常容易。

結論

隨著這次發布,OpenAI 正在發出信號,「提示工程」(Prompt Engineering)時代正在演變為「代理工程」(Agent Engineering)。從靜態文本生成到動態、熟練執行的轉變,使企業能夠部署不僅會說話、而且會「實作」的 AI。透過解決沙箱化和記憶體管理的基礎設施挑戰,升級後的 Responses API 消除了構建自主軟體工程師、數據分析師和行政助理所需的繁重工作。

對於正在構建下一代 AI 應用程式的 Creati.ai 讀者來說,訊息很明確:是時候停止編寫提示詞,開始封裝代理技能了。

精選