
ServiceNow 與 OpenAI 已宣布一項具有里程碑意義的多年戰略夥伴關係,將 OpenAI 先進的 GPT-5.2 模型直接整合到 ServiceNow 平台中。此合作標誌著企業 AI 生態的決定性轉向,從生成式協助(generative assistance)與生成式AI(Generative AI)時代,邁入「具行動能力的AI(Agentic AI)」時代──能夠在企業內自動執行複雜工作流程的系統。
該協議於 2026 年 1 月 20 日星期二公布,將 OpenAI 的前沿模型定位為 ServiceNow 廣大生態系統的首選智慧引擎;該生態系統目前每年處理超過 800 億 個工作流程。透過嵌入 GPT-5.2 的多模態(multimodal)能力──具體而言其「Computer Use」與原生語音對語音(speech-to-speech)功能──ServiceNow 旨在把 Now Platform 轉變為自主商業運作的樞紐,減少在 IT、HR 與客服等日常任務上對人工介入的需求。
過去三年,企業領域主要被「copilot」範式支配,在該範式中,AI 作為會話助理,撰寫電子郵件草稿、摘要文件與回覆查詢。ServiceNow 與 OpenAI 的聯盟顯示產業已成熟,進入「具行動能力的AI(Agentic AI)」階段,在此階段軟體不僅建議行動,還會執行行動。
此轉變的核心是整合 GPT-5.2,該模型在推理能力與「以行動為導向」的架構上,相較於前代有明顯提升。不同於過去需要以文字提示並主要作為資訊檢索系統運作的版本,GPT-5.2 被設計為能夠操作使用者介面、理解複雜視覺情境,並執行多步驟流程。
「ServiceNow 正在協助企業將具行動能力的 AI 帶入安全、可擴展並能帶來可衡量成果的工作流程中,」OpenAI 首席營運長 Brad Lightcap 表示。「結合 OpenAI 的前沿模型與 ServiceNow 的多模態能力後,各行各業的企業都將受益於能在最複雜環境中端到端處理工作的智慧。」
這項能力透過 ServiceNow 的「AI 代理(AI Agents)」得以實現,這些代理現在可以自主管理例如下列任務:
此合作的一項關鍵技術突破是部署原生語音對語音(native speech-to-speech)技術。傳統語音 AI 系統仰賴「轉錄─處理─合成」的循環,音訊先被轉成文字,由大型語言模型(LLM)處理,然後再轉回語音。此流程會引入延遲,且常常剝離語調與緊迫感等副語言線索。
GPT-5.2 的原生音訊能力允許 ServiceNow 代理在無需文字中介的情況下「聆聽、推理並回應」即時互動。這種延遲的降低對於如客戶支援中心與 IT 幫助台等高風險環境至關重要。
ServiceNow 總裁兼 COO 兼 CPO Amit Zavery 強調此技術的實際應用:「ServiceNow 與 OpenAI 正在建構 AI 體驗的未來:部署能在複雜企業環境中端到端採取行動的 AI──而不是在沙盒中運作的 AI。」
整合承諾提供無縫體驗,員工可口頭要求:「更新我在下個財政年度的福利並把變更摘要寄給我」,AI 代理便會在數秒內瀏覽 HR 入口網站、執行變更並口頭確認完成。
對 OpenAI 而言,此合作代表其企業策略的持續演進。OpenAI 並非僅透過 ChatGPT Enterprise 的直接銷售競爭,而是取得「設計導入(design-in)」勝利──將其模型深度嵌入主要軟體供應商的基礎設施中。透過驅動 ServiceNow 的後端,OpenAI 確保其技術被全球 2000 大企業在關鍵營運層廣泛採用。
這一做法類似半導體業的「Intel Inside」策略,價值在於成為驅動大量應用程式的不可或缺引擎。OpenAI 已與 Broadcom、Oracle 等建立夥伴關係,與 ServiceNow 的交易進一步鞏固了 OpenAI 作為企業智慧基礎設施的角色。
對 ServiceNow 而言,此交易建立了一道對抗 Salesforce 與 Microsoft 等競爭者的強大護城河。透過提供由市場上最先進模型驅動的「開箱即用」自主代理,ServiceNow 能向面臨展示 AI 投資成果壓力的資訊長(CIO)承諾即時的投資報酬。
要理解此更新的重大性,必須比較先前世代整合式 AI 與 GPT-5.2 所解鎖的新能力。
Table 1: Evolution of Enterprise AI Capabilities
| Feature | Traditional GenAI (GPT-4 Era) | Agentic AI (GPT-5.2 Era) |
|---|---|---|
| Primary Function | 內容生成與摘要 | 任務執行與工作流程編排 |
| Interaction Mode | 以文字為主的聊天(提示與回應) | 多模態(語音、文字、視覺介面互動) |
| Autonomy Level | 被動(等待人類指令) | 主動(可觸發自發行動) |
| Latency | 高(文字到語音之間的翻譯層) | 即時(原生語音對語音) |
| Integration Depth | 表層(透過 API 呼叫取得資訊) | 深度(透過「Computer Use」進行系統級控制) |
| Decision Making | 提供人類選項供其選擇 | 在治理護欄內執行決策 |
隨著 AI 系統從被動建議轉向主動執行,治理成為企業領導者的首要關切。能夠重設密碼或轉移資金的 AI 代理,其風險輪廓明顯高於僅草擬電子郵件的系統。
ServiceNow 透過其「AI 控制塔(AI Control Tower)」來因應此一需求,這是一套設計用以監控與管理這些自主代理的治理框架。該系統提供:
這種對「受治理的自主性(governed autonomy)」的重視,正是 ServiceNow x OpenAI 所提供方案與開放式消費型 AI 工具之間的區別。它有效地橋接了原始大型語言模型的混沌潛力與企業合規的嚴格要求之間的落差。
此交易的三年範圍暗示了一條長期路線圖,將整合更先進的功能。隨著 GPT-5.2 的演進,我們可預期出現多代理系統,不同專長的 AI 代理──如法律、財務或工程──會在無需人類協調的情況下協同解決跨部門問題。
ServiceNow 產品管理資深副總裁 John Aisien 指出產業正面臨快速的臨界點變化:「隨著 AI 模型發布速度加快,大型企業需要協助以保持其工作流程與最新創新同步。」
透過將 AI 模型管理的複雜性與最終使用者體驗脫鉤,ServiceNow 讓企業能夠在不斷重新架構內部系統的情況下,搭乘 AI 進步的浪潮。該夥伴關係傳達的訊息很明確:企業 AI 的實驗階段已結束。現在的焦點是部署、行動,以及業務工作的具體自動化。
對 Creati.ai 的讀者而言,這一發展突顯掌握「具行動能力」工作流程的重要性。未來的技能組合將較少是對聊天機器人進行「提示工程(prompt engineering)」,而更多是進行「工作流程工程(workflow engineering)」──為能替企業執行工作的自主代理設計邏輯、權限與目標。