
Google a officiellement inauguré l’ère du « web agentif » (agentic web) avec le lancement de sa fonctionnalité très attendue Auto Browse pour Chrome. Annoncée le 28 janvier 2026, cette mise à jour intègre le modèle avancé Gemini AI — plus précisément la nouvelle itération Gemini 3 — directement dans le navigateur le plus populaire au monde. Pour la première fois, Chrome n'est plus seulement une fenêtre sur Internet, mais un participant actif, capable d'effectuer de manière autonome des tâches complexes en plusieurs étapes pour le compte de l'utilisateur.
Ce déploiement stratégique vise les utilisateurs du niveau premium de Google, plus précisément ceux abonnés aux offres AI Pro et Ultra aux États-Unis. En intégrant des capacités agentives (agentic capabilities) dans l'infrastructure du navigateur, Google ne se contente pas de rattraper des concurrents comme OpenAI et Perplexity : il les dépasse potentiellement en tirant parti de la base installée massive de Chrome et de son intégration approfondie avec l'écosystème web.
Le cœur de cette mise à jour est le passage de la « recherche » à « l'action ». La navigation traditionnelle exige que les utilisateurs parcourent manuellement les sites, filtrent les informations et saisissent des données. Auto Browse renverse ce paradigme. Les utilisateurs peuvent désormais déléguer des tâches en plusieurs étapes — telles que « trouver un hôtel-boutique à Chicago pour moins de 300 $ et vérifier la disponibilité pour le week-end prochain » ou « acheter les fournitures nécessaires pour recréer ce photobooth DIY » — à Chrome.
Lorsqu'une tâche est lancée via le nouveau panneau latéral persistant Gemini, Gemini AI prend le relais. Il ouvre un nouvel onglet, identifiable par une icône « scintillement » unique et un curseur « fantôme » visible, permettant aux utilisateurs de regarder l'IA naviguer, cliquer, faire défiler et taper en temps réel. Surtout, ce processus peut s'exécuter en arrière-plan, libérant les utilisateurs pour qu'ils continuent de travailler dans d'autres onglets pendant que l'agent accomplit sa mission.
La technologie sous-jacente s'appuie sur les capacités multimodales (multimodal capabilities) de Gemini 3 et une compréhension sophistiquée du Modèle d'objets du document (Document Object Model, DOM). Cela permet au navigateur de « voir » et d'interagir avec les pages web comme le ferait un humain, en identifiant les boutons « Ajouter au panier » (Add to Cart), en remplissant des formulaires complexes et en parcourant plusieurs pages pour consolider les informations.
Une préoccupation principale concernant Agents d'IA (AI Agents) est le risque d'actions non intentionnelles, notamment pour les transactions financières ou les communications. Google a répondu par un protocole strict « humain dans la boucle » (human-in-the-loop). Bien que Auto Browse puisse naviguer jusqu'à une page de paiement, remplir les informations de livraison et appliquer des codes de réduction, il ne peut pas exécuter la commande finale « Acheter » (Buy) ou « Publier » (Post) sans confirmation explicite de l'utilisateur.
De plus, le système a été conçu dans un souci de transparence. Le nouveau panneau latéral fournit un journal étape par étape des actions de l'agent (par ex. : « Navigation vers Etsy (Navigating to Etsy) », « Sélection de l'article (Selecting Item) », « Remplissage de l'adresse (Filling Address) »). Les utilisateurs peuvent intervenir à tout moment en cliquant sur un bouton « Reprendre la tâche (Take over task) », mettant instantanément l'IA en pause et rendant le contrôle manuel à l'utilisateur. Cet équilibre entre autonomie et supervision est essentiel pour instaurer la confiance dans Technologie du navigateur (Browser Technology) qui agit au nom de l'utilisateur.
| Fonctionnalité | Expérience Chrome standard | Chrome avec Gemini Auto Browse |
|---|---|---|
| Exécution des tâches | L'utilisateur visite manuellement des sites, clique sur des liens et saisit des données. | Agents d'IA naviguent de manière autonome, font défiler et saisissent des données. |
| Multitâche | Nécessite la concentration de l'utilisateur ; l'onglet actif doit être visible. | S'exécute dans des onglets en arrière-plan ; l'utilisateur peut se concentrer ailleurs. |
| Flux de travail complexes | L'utilisateur gère le contexte à travers plusieurs onglets/fenêtres. | Gemini conserve le contexte entre les onglets pour accomplir des objectifs en plusieurs étapes. |
| Commerce | L'utilisateur recherche des codes et compare les prix manuellement. | L'agent applique des codes, compare les paniers et préremplit le paiement. |
| Modèle de sécurité | Protection contre le phishing via Safe Browsing API. | Détection des arnaques sur l'appareil via Gemini Nano + confirmation humaine. |
Cette mise à jour ne concerne pas uniquement la navigation ; elle représente une refonte complète de la pile d'IA de Chrome. Aux interactions légères et locales s'ajoute Gemini Nano, qui s'exécute désormais localement pour détecter en temps réel les arnaques et les pop-ups malveillants sans envoyer de données vers le cloud.
De plus, la mise à jour introduit une fonctionnalité, en interne nommée « Nano Banana », un outil d'édition d'images intégré au navigateur. Cela permet aux utilisateurs de modifier des images trouvées sur le web (par ex. : « supprimer l'arrière-plan de cette photo de produit ») directement dans l'onglet du navigateur avant de les enregistrer ou de les partager, réduisant ainsi encore la friction entre consommation et création.
Google a également implémenté la prise en charge du « Universal Commerce Protocol » (UCP), une norme développée en partenariat avec des détaillants majeurs comme Shopify et Target. L'UCP permet à l'agent Auto Browse d'interagir de manière plus fiable avec les paniers d'achat et les catalogues de produits, réduisant le taux d'« hallucinations » où un agent pourrait tenter de cliquer sur un bouton qui n'existe pas.
La fonctionnalité Auto Browse est actuellement disponible exclusivement pour les abonnés Google AI Pro et Ultra aux États-Unis. Ce déploiement par paliers suggère que Google considère la navigation agentive (agentic browsing) comme un outil de productivité premium plutôt qu'une utilité standard, du moins pour l'instant.
Cette initiative place Google en confrontation directe avec les navigateurs « nativement IA » émergents. Si des startups ont expérimenté des fonctionnalités similaires, la domination de Chrome lui confère un avantage unique : il n'a pas besoin de convaincre les utilisateurs de changer de navigateur, seulement d'améliorer leur expérience existante. Pour les éditeurs web et les spécialistes SEO, l'avènement de la navigation agentive (agentic browsing) annonce un avenir volatile où optimiser pour la capacité d'un agent d'IA à naviguer sur un site pourrait devenir aussi important qu'optimiser pour l'attention d'un humain.
Alors que Gemini AI continue d'évoluer, on peut s'attendre à ce que ces fonctionnalités s'étendent au-delà des États-Unis et éventuellement se diffusent aux utilisateurs de la tranche gratuite, changeant fondamentalement Internet d'une bibliothèque que nous parcourons en un service qui travaille pour nous.