AI News

OpenAI 透過 Responses API 的重大更新重新定義自主工作流(Autonomous Workflows)

為了鞏固其在代理式 AI(Agentic AI)領域的領先地位,OpenAI 採取了果斷行動,針對其 Responses API 推出了全面升級。昨天宣布的這次發布,引入了代理技能(Agent Skills)託管 Shell 容器(Hosted Shell Containers)以及伺服器端壓縮(Server-Side Compaction)——這三項功能旨在將 AI 開發從簡單的聊天機器人轉型為強大、且能長期運行的自主代理。

這次更新代表了企業開發者的範式轉移(Paradigm Shift)。透過標準化 AI 模型執行複雜程序的方式,並管理長時間任務的運算開銷,OpenAI 正在直接解決代理式工作流中常見的「脆弱性」。隨著新模型 GPT-5.2 的同步整合,這些工具承諾讓自主代理變得更可靠、更具版本化管理能力且更易於擴展。

新標準:代理技能(Agent Skills)

這次更新的核心是引入了 代理技能(Agent Skills),這是一個用於封裝可重複使用行為的標準化框架。此前,開發者被迫將複雜的程序邏輯「塞進」龐大的系統提示(System Prompts)中,導致上下文膨脹和模型遵循度的不穩定。

代理技能透過允許開發者將指令、腳本和資產(例如 Python 文件或範本)打包進一個由 SKILL.md 清單(Manifest)定位的獨立套件中,解決了這個問題。

根據新文檔,技能(Skill)不僅僅是一個工具定義;它是一個可移植的「能力模組」。當開發者將一項技能附加到 Responses API 時,模型會充當智能編排者。它閱讀技能的清單以了解何時使用它,但僅在觸發特定工作流時,才加載完整的程序上下文並執行相關腳本。

技能框架的主要優勢

  • 模組化: 技能可以獨立於核心應用程式代碼進行版本控制和交付。
  • 上下文效率: 程序指令按需加載,保持主系統提示簡潔。
  • 可重複性: 透過將特定資產(如 CSV 範本或格式化腳本)與指令綑綁,代理能在不同運行中產生一致的輸出。

完整的終端 Shell 支援

為了驅動這些技能,OpenAI 升級了 Responses API,使其具備完整的終端 Shell 支援。開發者現在可以在兩種執行環境之間進行選擇:託管 Shell 容器(Hosted Shell Containers) (container_auto) 和 本地 Shell(Local Shells)

託管 Shell 對於企業部署尤為重要。它提供了一個安全、沙箱化的環境,模型可以在其中編寫代碼、操作文件並執行多步終端命令,而不會危及主機基礎架構。這有效地為 GPT-5.2 提供了一台可以運作的「電腦」,使其能夠完全在 API 託管的基礎架構內執行數據清理、報告生成或代碼重構等任務。

對於需要訪問內部資源的開發者,本地 Shell 整合允許模型在開發者自己的環境中驅動 Shell,架起了雲端智能與本地數據安全之間的橋樑。

透過伺服器端壓縮解決記憶體瓶頸

這次發布中最重要的技術補充之一是 伺服器端壓縮(Server-Side Compaction)。當代理執行長時間運行的任務時——例如研究一個主題數小時或調試大型代碼庫——對話歷史通常會不斷增長,直到達到模型的上下文窗口限制。

伺服器端壓縮將對話中較舊部分的摘要和截斷過程自動化。與以往開發者必須構建自己的「摘要器」循環的手動實現不同,這項原生功能在後台管理上下文窗口。它確保代理保留先前操作的「要點」,同時為新的推理步驟騰出空間,從而使複雜任務在理論上具備無限的運行時間。

比較:系統提示 vs. 代理技能 vs. 工具

為了理解代理技能在現有生態系統中的定位,我們分析了三種主要導引模型行為方法之間的區別。

表 1:控制機制的戰略用途

功能 系統提示 (System Prompts) 代理技能 (Agent Skills) 工具 (Tools)(函數調用)
主要功能 定義全域角色和限制 執行可重複的多步程序 執行副作用或獲取數據
上下文影響 始終加載(高影響) 按需加載(高效) 加載 Schema;加載結果
版本控制 難以進行細粒度版本管理 可獨立控制版本的套件 透過 API Schemas 進行版本控制
最佳使用場景 安全規則、語氣、「始終開啟」的策略 數據流水線、報告生成、複雜邏輯 數據庫查詢、API 整合、網頁搜索
執行方式 上下文內的指令遵循 透過 Shell 的沙箱執行 外部函數執行

開發者體驗與邁向 GPT-5.2

這次更新與 GPT-5.2 的發布緊密整合,該模型專門針對此類多步推理和工具使用進行了優化。早期基準測試表明,與前代產品相比,GPT-5.2 在執行複雜技能的過程中更不容易「迷失」。

開發者可以立即透過新的 POST /v1/skills 端點開始上傳技能。該 API 支援以 ZIP 壓縮檔形式上傳技能,使得將技能部署整合到現有的 CI/CD 流水線中變得非常容易。

結論

隨著這次發布,OpenAI 正在發出信號,「提示工程」(Prompt Engineering)時代正在演變為「代理工程」(Agent Engineering)。從靜態文本生成到動態、熟練執行的轉變,使企業能夠部署不僅會說話、而且會「實作」的 AI。透過解決沙箱化和記憶體管理的基礎設施挑戰,升級後的 Responses API 消除了構建自主軟體工程師、數據分析師和行政助理所需的繁重工作。

對於正在構建下一代 AI 應用程式的 Creati.ai 讀者來說,訊息很明確:是時候停止編寫提示詞,開始封裝代理技能了。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
Claude API
Claude API for Everyone
EaseMate AI
一站式 AI 助理,將聊天、寫作、學習輔助、圖片創作與影片生成整合於同一個基於瀏覽器的平台。
InstantChapters
即時生成吸引人的書籍章節。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

OpenAI 升級 Responses API,新增代理人技能與完整終端 Shell 支援

OpenAI 強化其 Responses API,加入伺服器端壓縮、託管的 shell 容器,以及作為建立長期執行自主 AI 代理人的技能標準。