AI News

Google 以 Gemini AI 驅動的自動瀏覽(Auto Browse)在 Chrome 重新定義網路

Google 已於 2026 年 1 月 28 日正式開啟「代理式網路」(agentic web)的時代,推出備受期待的 自動瀏覽(Auto Browse) 功能給 Chrome。此更新將先進的 Gemini AI 模型——具體為新版 Gemini 3——直接整合到世界上最受歡迎的瀏覽器中。Chrome 不再只是通往網際網路的視窗,而是能代表使用者自主執行複雜、多步驟任務的主動參與者。

此策略性發布針對的是 Google 的高階付費用戶,特別是美國訂閱 AI Pro 及 Ultra 計畫的使用者。透過在瀏覽器基礎架構中嵌入代理能力,Google 不僅在追趕像 OpenAI 與 Perplexity 等競爭者,還可能藉由 Chrome 廣泛的用戶基礎與與網路生態系的深度整合實現領先。

從被動瀏覽到主動代理的轉變(The Shift from Passive Browsing to Active Agents)

此更新的核心在於從「搜尋」轉向「行動」。傳統瀏覽需要使用者手動導覽網站、篩選資訊與輸入資料。自動瀏覽(Auto Browse) 顛覆了這一範式。使用者現在可以將多步驟的瑣事委派給 Chrome,例如「找一間芝加哥市區、每晚低於 300 美元且下週末有空房的精品旅館」,或是「購買重製這個 DIY 拍照亭所需的用品」。

當任務透過新的常駐 Gemini 側欄啟動時,Gemini AI 會接手。它會開啟一個新分頁,該分頁以獨特的「閃爍」圖示和可見的游標幽靈為標誌,讓使用者可以即時觀看 AI 導覽、點擊、捲動與輸入。關鍵在於,這個過程可以在背景執行,讓使用者在其他分頁繼續工作,同時代理完成其指派任務。

底層技術依賴 Gemini 3 的多模態能力以及對文件物件模型(DOM)的精巧理解。這讓瀏覽器能像人類一樣「看見」並與網頁互動,辨識「加入購物車」按鈕、填寫複雜表單,並穿梭多個頁面以彙整資訊。

安全防護與「人類在環路」的控制

對於 AI 代理(AI Agents),主要的擔憂在於可能發生的非預期行為,特別是在金錢交易或通訊方面。Google 以嚴格的「人類在環路」協定回應此問題。雖然 自動瀏覽 可導到結帳頁面、填寫配送資訊並套用折扣碼,但在未經使用者明確確認前,不能執行最終的「購買」或「發布」指令。

此外,系統在設計上強調透明度。新的側欄會提供代理行為的逐步日誌(例如:「導覽至 Etsy」、「選取商品」、「填寫地址」)。使用者可在任何時刻點擊「接管任務」按鈕介入,立即暫停 AI 並回復手動控制。這種自治與監督的平衡對於建立對代表使用者行動的 瀏覽器技術(Browser Technology) 的信任至關重要。

功能拆解:標準 Chrome 與具 Gemini 自動瀏覽的 Chrome

傳統的 Chrome 體驗和這種新代理工作流程之間的差異顯著。下表列出此更新引入的主要操作轉變。

Feature Standard Chrome Experience Chrome with Gemini Auto Browse
Task Execution User manually visits sites, clicks links, and inputs data. AI Agents autonomously navigate, scroll, and input data.
Multitasking Requires user focus; active tab must be visible. Runs in background tabs; user can focus elsewhere.
Complex Workflows User manages context across multiple tabs/windows. Gemini holds context across tabs to complete multi-step goals.
Commerce User searches for codes, compares prices manually. Agent applies codes, compares carts, and pre-fills checkout.
Security Model Phishing protection via Safe Browsing API. On-device scam detection via Gemini Nano + Human confirmation.

(表格內容保留原文術語與標記以維持格式一致性)

引擎解析:Gemini 3 與 Nano Banana

此更新不僅關乎導覽;它代表對 Chrome AI 堆疊的全面改造。為了支援輕量且本地的即時互動,Gemini Nano 現在在裝置端執行,可在不將資料傳送到雲端的情況下即時偵測詐騙與惡意跳出視窗。

此外,更新還引入了內部代號為「Nano Banana」的功能,一種瀏覽器內的影像編輯工具。使用者可以直接在瀏覽器分頁中修改網路上找到的影像(例如:「移除這張產品照的背景」),然後再儲存或分享,進一步降低從消費到創作的摩擦。

Google 也實作了對「通用商務協定(Universal Commerce Protocol,UCP)」的支援,這是一項與 Shopify、Target 等大型零售商合作開發的標準。UCP 使 自動瀏覽 代理能更可靠地與購物車與產品目錄互動,降低代理嘗試點擊不存在按鈕時發生的「幻覺(hallucination)」率。

市場影響與可用性

目前 自動瀏覽 功能僅限於美國的 Google AI Pro 與 Ultra 訂閱者。這種分階段推出顯示 Google 將代理式瀏覽視為一項高階生產力工具,而非標準公用功能,至少在現階段是如此。

此舉使 Google 直接與新興的「以 AI 為本」瀏覽器競爭。雖然新創公司已嘗試類似功能,但 Chrome 的主導地位賦予它獨特優勢:它無需說服使用者改用另一款瀏覽器,只需升級現有的使用體驗。對於網路發行者與 SEO 專家來說,代理式瀏覽的到來意味未來將高度不穩定——為 AI 代理優化網站的可導覽性,可能會變得和為人類吸引注意力一樣重要。

隨著 Gemini AI 持續演進,我們可預期這些功能將擴展到美國以外,並可能下放至免費階層使用者,從根本上改變我們從「搜尋的資料庫」到「為我們工作的服務」的互聯網形態。

精選