AI News

El CEO de DeepMind desafía la estrategia de OpenAI y aboga por "Modelos del Mundo (World Models)"

En un momento definitorio para la industria de la inteligencia artificial, el CEO de Google DeepMind, Demis Hassabis, desafió públicamente el predominio vigente de los Modelos de Lenguaje a Gran Escala (Large Language Models, LLMs), argumentando que la vía actual favorecida por competidores como OpenAI es insuficiente para alcanzar la verdadera Inteligencia Artificial General (Artificial General Intelligence, AGI). Hablando en el podcast "The Tech Download" de CNBC el 19 de enero de 2026, Hassabis articuló un giro estratégico hacia los "Modelos del Mundo (World Models)", sistemas capaces de simular la realidad física y comprender la causalidad, en lugar de limitarse a predecir texto basándose en correlaciones estadísticas.

Esta crítica marca una divergencia significativa en las hojas de ruta filosóficas y técnicas de los principales laboratorios de IA del mundo. Mientras que OpenAI, liderada por Sam Altman, históricamente ha insistido en las leyes de escalado—la idea de que aumentar el cómputo y el volumen de datos conduce inevitablemente a una mayor inteligencia—Hassabis sugiere que este enfoque ha chocado con una "pared fundamental" cuando se trata de invención científica y razonamiento desde primeros principios.

La limitación del escalado basado en texto

El núcleo del argumento de Hassabis se basa en la distinción entre el procesamiento de información y la comprensión física. Los Modelos de Lenguaje a Gran Escala (LLMs) sobresalen al analizar enormes cantidades de texto generado por humanos para encontrar patrones. Sin embargo, Hassabis sostiene que estos modelos "no entienden verdaderamente la causalidad." Pueden describir una manzana que cae basándose en descripciones en sus datos de entrenamiento, pero no pueden simular la física de la gravedad en un entorno novedoso para predecir un resultado que no hayan visto antes.

"Los grandes modelos de lenguaje de hoy son fenomenales en el reconocimiento de patrones," declaró Hassabis durante la entrevista. "Pero realmente no saben por qué A conduce a B. Solo predicen el siguiente token."

Para los lectores de Creati.ai, esta distinción es crucial. Implica que, si bien los LLMs seguirán mejorando como interfaces conversacionales y asistentes de programación, podrían seguir siendo incapaces del tipo de avances a escala AlphaGo necesarios para resolver problemas científicos complejos, como descubrir nuevos materiales o curar enfermedades. Hassabis estima que la AGI sigue a 5–10 años de distancia y requerirá arquitecturas que vayan más allá del paradigma basado en transformers.

Definiendo el "Modelo del Mundo"

La visión alternativa de DeepMind se centra en crear IA que construya una representación interna del mundo físico. Estos "Modelos del Mundo" funcionan menos como una biblioteca y más como un motor de juego. Pueden ejecutar "experimentos mentales", simular resultados en espacio 3D y comprobar hipótesis frente a un conjunto consistente de leyes físicas.

DeepMind ya ha comenzado a demostrar la viabilidad de este enfoque. Hassabis señaló a Genie 3, un sistema lanzado en agosto de 2025, que genera entornos 3D interactivos a partir de indicaciones de texto, y SIMA 2, que entrena agentes de IA para navegar y realizar tareas dentro de estos mundos simulados. Investigaciones tempranas sugieren que estos sistemas híbridos—combinando comprensión del lenguaje con razonamiento espacial—superan a los LLMs puros en un 20–30 % en tareas de razonamiento complejo y reducen significativamente las alucinaciones sobre física básica.

Divergencia estratégica: Google vs. OpenAI

El momento de estos comentarios no es casual. La industria de la IA está navegando actualmente un período de intensa volatilidad. Tras el lanzamiento de Gemini 3 de Google a finales de 2025, surgieron informes sobre un "Código Rojo" interno en OpenAI, impulsado por la preocupación de que su estrategia de escalado estaba rindiendo retornos decrecientes. Al articular públicamente las limitaciones de la vía basada únicamente en LLMs, Hassabis está posicionando a Google no solo como competidor, sino como pionero del próximo salto arquitectónico en IA.

Este cambio es operacional además de filosófico. Hassabis reveló que ahora está en contacto diario con el CEO de Alphabet, Sundar Pichai, un cambio que subraya el estatus elevado de DeepMind como la "sala de máquinas" singular de los esfuerzos de IA de Google. Esta estructura optimizada apunta a acelerar la traducción de avances de investigación en productos de consumo, una respuesta directa a las críticas de que Google había avanzado demasiado lentamente.

El contexto geopolítico: China acortando la distancia

Más allá del debate técnico, Hassabis ofreció una evaluación aleccionadora del panorama global de la IA. Al preguntársele sobre la competencia internacional, señaló que los modelos de IA chinos están cerrando rápidamente la brecha de rendimiento con sus homólogos occidentales.

"Es cuestión de meses, no de años," comentó Hassabis respecto a la demora entre los modelos de frontera de EE. UU. y China. Citó avances rápidos de compañías como Alibaba y startups como Moonshot AI. Sin embargo, introdujo una distinción matizada: mientras que los laboratorios chinos son expertos en seguir rápidamente y en la excelencia de ingeniería, Hassabis cuestionó si el ecosistema actual en China fomenta la "mentalidad" específica requerida para avances científicos de cero a uno, como la invención original de la arquitectura Transformer por investigadores de Google.

Análisis comparativo: LLMs vs. Modelos del Mundo

Para entender lo que está en juego en este debate arquitectónico, es útil contrastar las capacidades y limitaciones de los dos enfoques dominantes que actualmente compiten por recursos.

Comparación entre Modelos de Lenguaje a Gran Escala y Modelos del Mundo

Feature Modelos de Lenguaje a Gran Escala (Large Language Models, LLMs) Modelos del Mundo (World Models)
Mecanismo central Reconocimiento de patrones estadísticos y predicción de tokens Simulación de la realidad física y causalidad
Fuente de datos primaria Texto, código e imágenes estáticas de Internet Entornos 3D, motores físicos y datos de vídeo
Capacidad de razonamiento Correlacional (lógica asociativa) Causal (razonamiento desde primeros principios)
Limitación clave Alucinaciones y falta de conciencia espacial Alto costo computacional para simulación en tiempo real
Caso de uso ideal Redacción creativa, programación, resumen Robótica, descubrimiento científico, agentes autónomos
Sistemas de ejemplo GPT-4, Claude 3, Llama 3 Genie 3, SIMA 2, AlphaFold

Implicaciones para la industria de la IA

La defensa de Hassabis de los Modelos del Mundo señala una tendencia industrial más amplia hacia sistemas de IA "neuro-simbólicos (neuro-symbolic)" o híbridos. Para desarrolladores y líderes empresariales, esto sugiere que la era de depender únicamente de la ingeniería de prompts (prompt engineering) para modelos basados en texto podría estar transitando hacia una fase donde la computación espacial y la simulación se conviertan en componentes críticos de la pila de IA.

Si la hipótesis de DeepMind resulta correcta, la próxima generación de IA no solo hablará sobre el mundo: podrá navegarlo. Esta capacidad es esencial para desbloquear la economía física, incluyendo la robótica avanzada y la experimentación científica autónoma. Mientras OpenAI continúa refinando el "cerebro" de la IA a través del lenguaje, DeepMind parece centrarse en dar a ese cerebro un cuerpo y un mundo que habitar.

A medida que 2026 se desarrolla, es probable que la industria vea una bifurcación en el desarrollo de modelos: un camino optimizado para la fluidez lingüística y otro para la inteligencia física. Para Creati.ai, estaremos monitoreando de cerca cómo estos Modelos del Mundo se integran con las herramientas generativas existentes, potencialmente creando una nueva clase de aplicaciones que fusionen la generación creativa con la precisión científica.

Destacados