AI News

GoogleはGemini AI搭載のAuto BrowseをChromeに導入し、ウェブを再定義

Googleは、待望の機能であるAuto BrowseをChrome向けに正式に導入し、「エージェント化されたウェブ(agentic web)」の時代を切り開きました。2026年1月28日に発表されたこのアップデートは、先進的なGemini AIモデル、特に新しいGemini 3のバージョンを世界で最も普及しているブラウザに直接統合します。これにより、Chromeは単なるインターネットへの窓ではなく、ユーザーに代わって複雑で多段階の作業を自律的に実行できる能動的な参加者となります。

この戦略的な展開は、米国のAI ProおよびUltraプランに加入しているGoogleのプレミアム層ユーザーを主な対象としています。ブラウザ基盤にエージェント機能を組み込むことで、GoogleはOpenAIやPerplexityなどの競合に追いつくだけでなく、Chromeの莫大なインストールベースとウェブエコシステムとの深い統合を活かして、むしろ先を行く可能性があります。

受動的なブラウジングから能動的なエージェントへの変化

このアップデートの核心は「検索」から「行動」への転換です。従来のブラウジングでは、ユーザーがウェブサイトを手動で移動し、情報を絞り込み、データを入力する必要がありました。**Auto Browse**はこのパラダイムを一変させます。ユーザーは「シカゴで300ドル以下のブティックホテルを探し、来週末の空き状況を確認する」や「このDIYフォトブースを再現するために必要な備品を購入する」といった多段階の作業をChromeに委任できます。

新しい常駐のGeminiサイドパネルからタスクが開始されると、**Gemini AI**が制御を引き継ぎます。AIは新しいタブを開き、独自の「スパークル」アイコンと可視のカーソルゴーストで区別され、ユーザーはAIがリアルタイムでナビゲート、クリック、スクロール、入力する様子を観覧できます。重要なのは、このプロセスがバックグラウンドで行われる場合があり、ユーザーは他のタブで作業を続けながらエージェントがタスクを完了するのを待つことができる点です。

基盤技術はGemini 3のマルチモーダル機能(multimodal capabilities)と、ドキュメントオブジェクトモデル(Document Object Model、DOM)に対する高度な理解に依拠しています。これによりブラウザは人間のようにウェブページを「見て」相互作用でき、「カートに追加」ボタンを特定したり、複雑なフォームに入力したり、情報を統合するために複数ページを横断したりすることが可能になります。

セーフティレールと人間による介入制御

**AIエージェント(AI Agents)**に関する主な懸念は、特に金銭的取引や通信において意図しない行動が発生する可能性です。Googleはこれに対し厳格な「人間による介入(human-in-the-loop)」プロトコルで対処しています。Auto Browseはチェックアウトページへ移動し、配送情報を入力し、割引コードを適用することはできますが、明示的なユーザー確認なしに最終的な「購入」や「投稿」コマンドを実行することはできません。

さらに、システムは透明性を重視して設計されています。新しいサイドパネルはエージェントのアクションをステップごとにログ表示します(例:「Etsyに移動」、「商品を選択」、「住所を入力」)。ユーザーはいつでも「タスクを引き継ぐ」ボタンをクリックして介入でき、即座にAIを一時停止して手動操作に戻せます。自律性と監督のこのバランスは、ユーザーに代わって行動する**ブラウザ技術(Browser Technology)**への信頼構築に不可欠です。

機能の内訳:標準のChromeとChrome Auto Browseの比較

従来のChromeの体験とこの新しいエージェント型ワークフローとの違いは大きい。以下の表は、このアップデートで導入された主要な運用上の変化を示しています。

Feature Standard Chrome Experience Chrome with Gemini Auto Browse
Task Execution User manually visits sites, clicks links, and inputs data. AI Agents autonomously navigate, scroll, and input data.
Multitasking Requires user focus; active tab must be visible. Runs in background tabs; user can focus elsewhere.
Complex Workflows User manages context across multiple tabs/windows. Gemini holds context across tabs to complete multi-step goals.
Commerce User searches for codes, compares prices manually. Agent applies codes, compares carts, and pre-fills checkout.
Security Model Phishing protection via Safe Browsing API. On-device scam detection via Gemini Nano + Human confirmation.

裏側:Gemini 3とNano Banana

このアップデートは単なるナビゲーション機能の追加にとどまらず、ChromeのAIスタック全体の包括的な見直しを示しています。軽量でデバイス上で動作するインタラクションを支えるのはGemini Nanoで、これがローカルで動作してクラウドにデータを送信することなくリアルタイムで詐欺や悪質なポップアップを検出します。

さらに、このアップデートでは内部コード名「Nano Banana」と呼ばれるブラウザ内画像編集ツールが導入されます。これによりユーザーはウェブ上で見つけた画像を(例:「この商品写真の背景を削除する」)タブ内で直接編集して保存または共有でき、消費と創作の間の摩擦をさらに低減します。

Googleはまた、ShopifyやTargetなどの大手小売業者と共同で開発された標準である「Universal Commerce Protocol(UCP)」のサポートも実装しました。UCPによりAuto Browseエージェントはショッピングカートや商品カタログとより確実に連携でき、エージェントが存在しないボタンをクリックしようとする「幻視(hallucination)」の発生率を低減します。

市場への影響と提供状況

Auto Browse機能は現在、米国のGoogle AI ProおよびUltra加入者に限定して提供されています。この段階的な展開は、少なくとも現時点ではGoogleがエージェント型ブラウジングを標準的なユーティリティではなくプレミアムな生産性ツールとして扱っていることを示唆しています。

この動きは、台頭する「AIネイティブ」ブラウザとGoogleを直接対立させるものです。スタートアップは同様の機能を試みてきましたが、Chromeの優位性はユニークな利点を与えます。それはユーザーにブラウザを乗り換えてもらう必要がなく、既存の体験を単にアップグレードしてもらえばよい点です。ウェブ出版者やSEO専門家にとって、エージェントがサイトをナビゲートしやすくする最適化が、人間の注目を集める最適化と同じくらい重要になるという不安定な未来の到来を示しています。

Gemini AIが進化を続けるにつれ、これらの機能は米国外へと拡大し、将来的には無料プランのユーザーにも降りてくる可能性があり、インターネットは私たちが検索する図書館から、私たちのために働くサービスへと根本的に変わることが期待されます。

フィーチャー