AI News

Google definiert das Web mit Gemini AI-gestütztem Auto Browse in Chrome neu

Google hat offiziell die Ära des „agentischen Webs (agentic web)“ eingeläutet mit der Einführung seiner mit Spannung erwarteten Funktion Auto Browse für Chrome. Angekündigt am 28. Januar 2026, integriert dieses Update das fortschrittliche Modell Gemini AI—konkret die neue Gemini 3-Iteration—direkt in den weltweit beliebtesten Browser. Zum ersten Mal ist Chrome nicht mehr nur ein Fenster ins Internet, sondern ein aktiver Teilnehmer, der komplexe, mehrschrittige Aufgaben autonom im Namen des Nutzers ausführen kann.

Diese strategische Einführung richtet sich an Googles Premium-Nutzer, konkret an Abonnenten der AI Pro- und Ultra-Pläne in den Vereinigten Staaten. Indem agentische Fähigkeiten in die Browser-Infrastruktur eingebettet werden, holt Google nicht nur zu Konkurrenten wie OpenAI und Perplexity auf, sondern überspringt sie womöglich, indem es Chromes enorme Installationsbasis und tiefe Integration ins Web-Ökosystem nutzt.

Der Wandel vom passiven Surfen zu aktiven Agenten

Kern dieses Updates ist der Wechsel von „Suche“ zu „Aktion“. Traditionelles Surfen erfordert, dass Nutzer Websites manuell navigieren, Informationen filtern und Daten eingeben. Auto Browse kehrt dieses Paradigma um. Nutzer können jetzt mehrschrittige Aufgaben delegieren—wie etwa „finde ein Boutique-Hotel in Chicago unter $300 und prüfe die Verfügbarkeit für nächstes Wochenende“ oder „kaufe die Materialien, die nötig sind, um diese DIY-Fotobox nachzubauen“—an Chrome.

Wenn eine Aufgabe über das neue permanente Gemini-Seitenfeld gestartet wird, übernimmt Gemini AI. Es öffnet einen neuen Tab, der durch ein einzigartiges „Funkeln“-Symbol und einen sichtbaren Cursor-Geist gekennzeichnet ist, sodass Nutzer dem KI-Agenten beim Navigieren, Klicken, Scrollen und Tippen in Echtzeit zusehen können. Entscheidend ist, dass dieser Prozess im Hintergrund stattfinden kann, sodass Nutzer in anderen Tabs weiterarbeiten können, während der Agent seine Aufgabe erfüllt.

Die zugrundeliegende Technologie stützt sich auf die multimodalen Fähigkeiten von Gemini 3 und ein ausgefeiltes Verständnis des Document Object Model (DOM). Dadurch kann der Browser Webseiten „sehen“ und mit ihnen interagieren, nahezu wie ein Mensch: Er erkennt „In den Warenkorb“-Buttons, füllt komplexe Formulare aus und durchläuft mehrere Seiten, um Informationen zu konsolidieren.

Sicherheitsvorkehrungen und Human-in-the-Loop-Kontrolle

Eine Hauptsorge bei KI-Agenten (AI Agents) ist die Möglichkeit unbeabsichtigter Aktionen, insbesondere bei finanziellen Transaktionen oder Kommunikation. Google hat dies mit einem strikten Human-in-the-Loop-Protokoll adressiert. Während Auto Browse zu einer Checkout-Seite navigieren, Versanddetails ausfüllen und Rabattcodes anwenden kann, darf es den abschließenden „Kaufen“- oder „Posten“-Befehl nicht ohne ausdrückliche Nutzerbestätigung ausführen.

Zudem ist das System auf Transparenz ausgelegt. Das neue Seitenfeld liefert ein Schritt-für-Schritt-Protokoll der Aktionen des Agenten (z. B. „Navigiere zu Etsy“, „Artikel auswählen“, „Adresse ausfüllen“). Nutzer können jederzeit eingreifen, indem sie auf eine Schaltfläche „Aufgabe übernehmen“ klicken, wodurch die KI sofort pausiert und die manuelle Kontrolle an den Nutzer zurückgegeben wird. Dieses Gleichgewicht aus Autonomie und Aufsicht ist entscheidend, um Vertrauen in die Browser-Technologie aufzubauen, die im Namen des Nutzers handelt.

Funktionsübersicht: Chrome Standard vs. Chrome Auto Browse

Der Unterschied zwischen der traditionellen Chrome-Erfahrung und diesem neuen agentischen Workflow ist erheblich. Die folgende Tabelle skizziert die wichtigsten betrieblichen Veränderungen, die dieses Update einführt.

Feature Standard Chrome Experience Chrome with Gemini Auto Browse
Task Execution User manually visits sites, clicks links, and inputs data. AI Agents autonomously navigate, scroll, and input data.
Multitasking Requires user focus; active tab must be visible. Runs in background tabs; user can focus elsewhere.
Complex Workflows User manages context across multiple tabs/windows. Gemini holds context across tabs to complete multi-step goals.
Commerce User searches for codes, compares prices manually. Agent applies codes, compares carts, and pre-fills checkout.
Security Model Phishing protection via Safe Browsing API. On-device scam detection via Gemini Nano + Human confirmation.

Unter der Haube: Gemini 3 und Nano Banana

Dieses Update dreht sich nicht nur um Navigation; es stellt eine umfassende Überarbeitung von Chromes KI-Stack dar. Für die leichtgewichtigen, lokal ausgeführten Interaktionen ist Gemini Nano verantwortlich, das nun lokal läuft, um Betrugsversuche und schädliche Pop-ups in Echtzeit zu erkennen, ohne Daten in die Cloud zu senden.

Zusätzlich führt das Update ein Feature mit dem internen Codenamen „Nano Banana“ ein, ein in-Browser Bildbearbeitungstool. Damit können Nutzer Bilder, die sie im Web finden (z. B. „Entferne den Hintergrund dieses Produktbildes“), direkt innerhalb des Browser-Tabs bearbeiten, bevor sie diese speichern oder teilen—was die Reibung zwischen Konsum und Kreation weiter verringert.

Google hat außerdem Unterstützung für das „Universal Commerce Protocol“ (UCP) implementiert, einen Standard, der in Zusammenarbeit mit großen Händlern wie Shopify und Target entwickelt wurde. UCP ermöglicht es dem Auto Browse-Agenten, zuverlässiger mit Warenkörben und Produktkatalogen zu interagieren und reduziert die Rate an „Halluzinationen“, bei denen ein Agent versucht, auf einen Button zu klicken, der nicht existiert.

Marktimplikationen und Verfügbarkeit

Die Funktion Auto Browse ist derzeit exklusiv für Google AI Pro- und Ultra-Abonnenten in den USA verfügbar. Dieser gestaffelte Rollout deutet darauf hin, dass Google agentisches Browsen vorerst als Premium-Produktivitätstool statt als Standarddienst behandelt.

Dieser Schritt bringt Google in direkte Konfrontation mit aufkommenden „AI-native“-Browsern. Während Startups mit ähnlichen Funktionen experimentiert haben, verschafft Chromes Dominanz ihm einen einzigartigen Vorteil: Es muss Nutzer nicht davon überzeugen, den Browser zu wechseln, sondern nur, ihr bestehendes Erlebnis aufzuwerten. Für Web-Publisher und SEO-Spezialisten signalisiert diese Morgendämmerung des agentischen Browsens eine volatile Zukunft, in der die Optimierung für die Fähigkeit eines KI-Agenten, eine Seite zu navigieren, ebenso wichtig werden könnte wie die Optimierung für die Aufmerksamkeit eines Menschen.

Während sich Gemini AI weiterentwickelt, ist damit zu rechnen, dass diese Funktionen über die USA hinaus ausgeweitet und möglicherweise auch für Nutzer der kostenlosen Stufe angeboten werden—was das Internet grundlegend von einer Bibliothek, die wir durchsuchen, zu einem Dienst macht, der für uns arbeitet.

Ausgewählt