AI News

Google redefine la web con Auto Browse potenciado por Gemini AI en Chrome

Google ha inaugurado oficialmente la era de la "web agentiva" (agentic web) con el lanzamiento de su tan esperado Auto Browse para Chrome. Anunciada el 28 de enero de 2026, esta actualización integra el avanzado modelo Gemini AI —específicamente la nueva iteración Gemini 3— directamente en el navegador más popular del mundo. Por primera vez, Chrome deja de ser solo una ventana a Internet para convertirse en un participante activo, capaz de realizar tareas complejas y multi‑paso de forma autónoma en nombre del usuario.

Esta implementación estratégica está dirigida a los usuarios del segmento premium de Google, específicamente a quienes están suscritos a los planes AI Pro y Ultra en los Estados Unidos. Al integrar capacidades agentivas en la infraestructura del navegador, Google no solo está alcanzando a competidores como OpenAI y Perplexity, sino que posiblemente los supera aprovechando la enorme base instalada de Chrome y su profunda integración con el ecosistema web.

El cambio de la navegación pasiva a los agentes activos

El núcleo de esta actualización es el cambio de "buscar" a "actuar". La navegación tradicional requiere que los usuarios naveguen manualmente por sitios web, filtren información e introduzcan datos. Auto Browse invierte ese paradigma. Ahora los usuarios pueden delegar tareas multi‑paso —como "encontrar un hotel boutique en Chicago por menos de $300 y comprobar disponibilidad para el próximo fin de semana" o "comprar los suministros necesarios para recrear este photobooth DIY"— a Chrome.

Cuando se inicia una tarea mediante el nuevo panel lateral persistente de Gemini, Gemini AI toma el control. Abre una nueva pestaña, distinguible por un icono único de "brillo" y un cursor fantasma visible, lo que permite a los usuarios ver en tiempo real cómo la IA navega, hace clic, desplaza y escribe. Crucialmente, este proceso puede ocurrir en segundo plano, permitiendo a los usuarios seguir trabajando en otras pestañas mientras el agente completa su asignación.

La tecnología subyacente se apoya en las capacidades multimodales de Gemini 3 y en una comprensión sofisticada del Document Object Model (DOM). Esto permite al navegador "ver" e interactuar con las páginas web de manera muy parecida a como lo haría un humano, identificando botones de "Añadir al carrito", rellenando formularios complejos y recorriendo varias páginas para consolidar información.

Controles de seguridad y control humano en el bucle

Una preocupación principal con Agentes de IA (AI Agents) es el potencial de acciones no deseadas, particularmente en lo que respecta a transacciones financieras o comunicaciones. Google ha afrontado esto con un estricto protocolo de "humano en el bucle". Aunque Auto Browse puede navegar hasta una página de pago, rellenar los datos de envío y aplicar códigos de descuento, no puede ejecutar el comando final de "Comprar" o "Publicar" sin la confirmación explícita del usuario.

Además, el sistema está diseñado con transparencia en mente. El nuevo panel lateral ofrece un registro paso a paso de las acciones del agente (p. ej., "Navegando a Etsy", "Seleccionando artículo", "Rellenando dirección"). Los usuarios pueden intervenir en cualquier momento haciendo clic en un botón "Tomar control de la tarea", pausando instantáneamente la IA y devolviendo el control manual al usuario. Este equilibrio entre autonomía y supervisión es crítico para generar confianza en la Tecnología del navegador (Browser Technology) que actúa en nombre del usuario.

Desglose de funciones: Chrome estándar vs. Chrome con Auto Browse

La diferencia entre la experiencia tradicional de Chrome y este nuevo flujo de trabajo agentivo es significativa. La siguiente tabla describe los principales cambios operativos introducidos con esta actualización.

Feature Standard Chrome Experience Chrome with Gemini Auto Browse
Task Execution User manually visits sites, clicks links, and inputs data. AI Agents autonomously navigate, scroll, and input data.
Multitasking Requires user focus; active tab must be visible. Runs in background tabs; user can focus elsewhere.
Complex Workflows User manages context across multiple tabs/windows. Gemini holds context across tabs to complete multi-step goals.
Commerce User searches for codes, compares prices manually. Agent applies codes, compares carts, and pre-fills checkout.
Security Model Phishing protection via Safe Browsing API. On-device scam detection via Gemini Nano + Human confirmation.

Bajo el capó: Gemini 3 y Nano Banana

Esta actualización no se trata únicamente de la navegación; representa una renovación integral del stack de IA de Chrome. Al frente de las interacciones ligeras y en el dispositivo está Gemini Nano, que ahora se ejecuta localmente para detectar estafas y ventanas emergentes maliciosas en tiempo real sin enviar datos a la nube.

Además, la actualización introduce una función con nombre en clave interno "Nano Banana", una herramienta de edición de imágenes dentro del navegador. Esto permite a los usuarios modificar imágenes encontradas en la web (p. ej., "eliminar el fondo de esta foto de producto") directamente en la pestaña del navegador antes de guardarlas o compartirlas, reduciendo aún más la fricción entre consumo y creación.

Google también ha implementado soporte para el "Universal Commerce Protocol" (UCP), un estándar desarrollado en colaboración con grandes minoristas como Shopify y Target. UCP permite que el agente Auto Browse interactúe de manera más fiable con los carritos de compra y los catálogos de productos, reduciendo la tasa de "alucinaciones" en la que un agente podría intentar hacer clic en un botón que no existe.

Implicaciones de mercado y disponibilidad

La función Auto Browse está actualmente disponible de forma exclusiva para los suscriptores de Google AI Pro y Ultra en los EE. UU. Este despliegue por fases sugiere que Google está tratando la navegación agentiva como una herramienta de productividad premium más que como una utilidad estándar, al menos por ahora.

Este movimiento coloca a Google en confrontación directa con navegadores emergentes "nativos de IA". Aunque las startups han experimentado con funciones similares, el dominio de Chrome le otorga una ventaja única: no necesita convencer a los usuarios para que cambien de navegador, solo para que mejoren su experiencia existente. Para los editores web y los especialistas en SEO, este amanecer de la navegación agentiva indica un futuro volátil en el que optimizar para la capacidad de un agente de IA de navegar por un sitio podría volverse tan importante como optimizar para la atención humana.

A medida que Gemini AI continúe evolucionando, podemos esperar que estas funciones se expandan más allá de los EE. UU. y potencialmente lleguen a los usuarios del nivel gratuito, cambiando fundamentalmente Internet de una biblioteca que consultamos a un servicio que trabaja para nosotros.

Destacados