OpenAI 將 Deep Research 升級至 GPT-5.2，具備網站特定搜尋功能

OpenAI 透過 GPT-5.2 整合提升研究能力

OpenAI 已正式為 ChatGPT 中的深度研究（Deep Research）功能推出了重大升級，現在由高度先進的 GPT-5.2 模型驅動該系統。這項策略性增強標誌著人工智慧處理複雜資訊檢索與綜合方式的關鍵轉變，從簡單的查詢響應轉向完全自主的代理式研究工作流（agentic research workflows）。此次更新引入了一系列期待已久的功能，最顯著的是在特定網站進行定向搜尋、與第三方應用程式整合，以及即時追蹤研究進度的能力。

對於依賴 AI 進行數據綜合的專業人士和學者來說，這次更新解決了先前版本中的幾個關鍵痛點。透過將底層架構從 o3 和 o4 mini 模型遷移到更強大的 GPT-5.2，OpenAI 旨在提高其研究代理的推理能力和上下文理解。此舉標誌著 OpenAI 持續致力於將 ChatGPT 從聊天機器人演變為一個全面的問題解決平台，能夠在極少的人為干預下執行多階段任務。

引入特定網站搜尋（website-specific search）功能對於法律研究、醫學分析和技術盡職調查等專業領域尤其具有變革性，在這些領域，資訊的出處與資訊本身同樣重要。用戶現在可以將 AI 的注意力引導至信任的網域，顯著減少通常與開放網路抓取相關的雜訊。

以 GPT-5.2 驅動深度研究

此次升級的核心在於 GPT-5.2 的整合，該模型代表了 OpenAI 生成式能力（Generative AI）的最新前沿。此前，於 2025 年推出的深度研究（Deep Research）依賴於 o3 和 o4 mini 模型。雖然這些模型效率很高，但有時缺乏處理深度複雜、多層次研究任務所需的細微推理。轉向 GPT-5.2 不僅僅是性能提升；這是一次根本性的架構升級，旨在增強系統的「代理（agentic）」行為。

GPT-5.2 為研究過程帶來了卓越的上下文保留和邏輯演繹。當用戶啟動深度研究（Deep Research）工作階段時，模型不只是尋找答案；它會制定研究策略。它將用戶的提示詞分解為子查詢，識別必要的資訊缺口，並執行多步驟計劃來收集數據。新模型的改進推理引擎使其能夠更好地評估來源的可信度，並將衝突的資訊綜合成連貫的敘述。

這一轉變也解決了深度研究中的「深度」問題。之前的模型可能會停留在表面層級的摘要，而 GPT-5.2 旨在更嚴謹地追蹤調查線索，遵循引用並交叉引用數據點以建立一份全面的報告。這種能力使 ChatGPT 不僅僅是一個對話夥伴，更是一個不知疲倦的研究助手，能夠將數小時的手動調查壓縮成幾分鐘的處理時間。

細粒度控制：特定網站搜尋

權力用戶社群最期待的功能之一終於到來：定向網站搜尋（Targeted Website Search）。過去， AI 網路瀏覽通常是一個「黑箱」過程——用戶可以要求資訊，但對 AI 在哪裡尋找幾乎沒有控制權，導致結果容易被低質量的 SEO 內容農場或不相關的部落格稀釋。

隨著這次更新，OpenAI 將控制權交還給了用戶。研究人員現在可以指示 ChatGPT 將其搜尋限制在特定的網域或 URL。這種細粒度的控制水平對於各種專業使用場景來說都是遊戲規則的改變者：

學術研究： 將搜尋限制在 .edu 網域或特定的存儲庫網站，如 arXiv 或 JSTOR（如果可以存取）。
市場分析： 專注於競爭對手網站或特定的財經新聞門戶，以收集原始數據，避免第三方聚合器的渲染。
技術文件： 引導 AI 僅在特定軟體版本的官方文件中進行搜尋，避免過時的論壇建議。

這項功能將深度研究從通用工具轉變為精密儀器。透過限制搜尋空間，用戶可以大幅提高輸出的相關性和可靠性。它有效地彌合了廣闊的網際網路與內部知識庫精選安全性之間的差距。

增強的工作流與互動性

除了模型升級和搜尋控制外，OpenAI 還顯著優化了深度研究（Deep Research）的使用者體驗（UX），以支援動態、專業的工作流。以往 AI 搜尋工具靜態的「等待並觀察」方式已被透明、互動的過程所取代。

即時進度追蹤

用戶現在可以查看正在展開的研究過程。界面會即時顯示 AI 的「思考過程」，顯示其正在執行哪些查詢、正在造訪哪些網站以及正在提取哪些數據。這種透明度對於建立對系統輸出的信任至關重要。如果用戶看到 AI 陷入不相關的無底洞，可以立即介入。

中斷與引導

新系統支援「人機協同（human-in-the-loop）」的互動性。用戶不再是被動的觀察者；他們可以中斷研究進度以詢問澄清問題、細化原始提示，或手動注入 AI 可能遺漏的新來源。這種協作方式模仿了與人類初級分析師的合作，其中糾偏是自然工作流的一部分。

全螢幕報告

複雜輸出只能顯示在狹窄聊天氣泡的日子已不復返。更新後的深度研究可以生成全螢幕、格式化的報告。這些報告旨在提高可讀性和直接效用，類似於專業簡報而非聊天記錄。它們通常包含引用、數據表和結構化摘要，可以輕鬆導出或共享。

深度研究能力對比

下表概述了上一代深度研究與全新 GPT-5.2 驅動版本之間的主要差異：

功能	舊版深度研究 (2025)	新版深度研究 (GPT-5.2)
底層模型	o3 / o4 mini	GPT-5.2
搜尋範圍	一般開放網路	定向 / 特定網站
用戶控制	被動（輸入並等待）	互動（中斷與引導）
輸出格式	標準聊天響應	全螢幕結構化報告
應用程式整合	有限 / 無	支援已連線的應用程式（Connected Apps）
透明度	黑箱處理	即時進度追蹤

AI 代理的興起

OpenAI 明確將此次更新定位為「AI 代理（AI agents）」部署邁出的重要一步。與對單一提示給出單一答案的標準聊天機器人不同，代理的定義在於其感知、推理、行動和迭代以達成複雜目標的能力。

在 GPT-5.2 上運行的深度研究體現了這種代理理念。它根據用戶的初始查詢獨立啟動多階段網路搜尋（multi-stage web searches）。它會判斷何時已有足夠資訊回答問題，以及何時需要深入挖掘。這種自主性正是「帶有 AI 的搜尋引擎」與真正的「AI 研究員」之間的區別。

連接外部應用程式的能力進一步放大了這種代理潛力。雖然所有相容應用程式的具體細節仍在演變，但該架構暗示了一個未來：深度研究不僅可以讀取網頁，還可以與內部企業數據、專案管理工具和文件存儲庫對接。這創造了一個整體的研究環境，使 AI 能夠將公共網路數據與專有的內部知識結合起來。

局限性與現實檢查

儘管各項能力有了令人印象深刻的飛躍，但對該技術的局限性保持現實的看法至關重要。OpenAI 對以下事實保持透明：雖然網路搜尋顯著降低了幻覺（hallucination）率，但並未完全消除。

錯誤的風險隨著生成文本的長度和複雜度而增加。即使是 GPT-5.2 也可能誤解一項複雜的研究，混淆兩個聽起來相似的來源，或根據有缺陷的數據提出令人信服的論點。大語言模型（LLMs）的「隨機鸚鵡（stochastic parrot）」性質，雖然透過即時網路搜尋的落地（grounding）得到了極大緩解，但仍是該技術的一個基本特徵。

因此，用戶必須繼續驗證關鍵資訊。新功能有助於這一驗證過程——透過允許特定網站搜尋並顯示研究路徑——但它們並不能取代人類判斷的需求。深度研究是一個強大的加速器，但準確性的最終責任仍落在人類用戶身上。

結論

OpenAI 深度研究升級至 GPT-5.2 不僅僅是版本號的增加；它是用戶與 AI 進行資訊探索互動方式的重構。透過將 GPT-5.2 的原始推理能力與特定網站搜尋和即時追蹤等精密控制相結合，OpenAI 打造了一款直接吸引對準確性和透明度要求更高的知識工作者的工具。

隨著 AI 代理（AI agent）領域的競爭日益激烈——競爭對手如 Anthropic 憑藉 Claude Opus 4.6 挑戰極限——OpenAI 專注於將深度的、自主的研究能力直接整合到聊天界面中，確保其仍是現代數位工作流中的核心工具。對於 Creati.ai 的讀者來說，這次更新代表了一種可以利用的強大新能力，前提是在使用時配備適當程度的監督與驗證。