
En un cambio sísmico para el panorama de la inteligencia artificial, David Silver, el principal científico investigador detrás de AlphaGo y una figura fundamental en Google DeepMind, ha anunciado su salida para lanzar una nueva iniciativa independiente, Ineffable Intelligence. El movimiento, confirmado el viernes, marca la más reciente salida de alto perfil de un gigante tecnológico y señala un creciente giro de la industria desde la Inteligencia Generativa (Generative AI) hacia la búsqueda de una superinteligencia autónoma y orientada a objetivos.
Silver, ampliamente considerado el "padre de AlphaGo", pasó más de una década en DeepMind, donde su trabajo en aprendizaje por refuerzo (Reinforcement Learning, RL) cambió fundamentalmente la trayectoria del campo. Su nueva startup pretende eludir la actual obsesión de la industria con Modelos de Lenguaje a Gran Escala (Large Language Models, LLMs), apostando en su lugar por la filosofía de la "Alberta School": que un agente que aprende a partir de la interacción y la recompensa es la única vía viable hacia la Inteligencia Artificial General (Artificial General Intelligence).
El nombre del nuevo laboratorio de Silver, Ineffable Intelligence, sirve como un desafío filosófico directo al status quo. Mientras que el actual auge de la IA está impulsado por sistemas que dominan el lenguaje humano —prediciendo probabilísticamente la siguiente palabra en una secuencia— la tesis de Silver postula que los aspectos más críticos de la inteligencia son "inefables", o imposibles de capturar solo mediante el lenguaje.
"El lenguaje es una compresión de la experiencia, no la experiencia misma", declaró Silver en una rueda de prensa tras el anuncio. "Para alcanzar la superinteligencia, debemos construir agentes que aprendan desde cero mediante ensayo, error y descubrimiento, tal como hizo AlphaZero. Estamos avanzando más allá de la era de los conjuntos de datos estáticos hacia la era de la experiencia infinita."
La startup tiene la intención de centrarse exclusivamente en Aprendizaje por refuerzo (RL) capaz de planificación a largo plazo y descubrimiento científico novedoso, en lugar de chatbots o medios generativos. Esto se alinea con el famoso artículo de Silver de 2021, Reward is Enough, que argumentaba que la maximización de la recompensa es suficiente para explicar la aparición de todo comportamiento inteligente.
La salida de Silver forma parte de un fenómeno más amplio de "neolab", en el que investigadores de primer nivel abandonan laboratorios corporativos consolidados para fundar startups ágiles y orientadas a una misión. Esta tendencia refleja una fragmentación en la comunidad de IA sobre la mejor vía a seguir. Mientras compañías como OpenAI y Google se centran en escalar transformadores, investigadores como Silver (y el ex científico jefe de OpenAI Ilya Sutskever) están apostando por arquitecturas alternativas.
Ineffable Intelligence se une a una cohorte creciente de laboratorios de investigación de élite emergentes en Londres y San Francisco, con el objetivo de resolver los cuellos de botella de razonamiento y fiabilidad que actualmente afectan a los LLMs.
Table: The Strategic Divide in Modern AI Development
| Feature | Generative AI (LLMs) | Reinforcement Learning (RL) |
|---|---|---|
| Core Objective | Predecir el siguiente token en una secuencia | Maximizar la recompensa futura acumulada |
| Learning Source | Conjuntos de datos estáticos (texto/imágenes de internet) | Interacción dinámica con entornos |
| Capabilities | Resumen, traducción, creación de contenido | Planificación, estrategia, descubrimiento novedoso |
| Limitations | Alucinaciones, falta de verdadero anclaje | Alto coste computacional para la simulación |
| Primary Goal | Imitación humana | Optimización sobrehumana |
David Silver’s approach is deeply rooted in the "Alberta School" of AI, influenced by his mentor, Richard Sutton. Esta corriente de pensamiento prioriza métodos "computacionalmente escalables" que no dependen de datos etiquetados por humanos.
Durante su etapa en Google DeepMind, Silver aplicó estos principios para crear AlphaGo, que sorprendió al mundo en 2016 al derrotar al campeón mundial Lee Sedol, y posteriormente AlphaZero y MuZero, que dominaron el ajedrez, el shogi y el go sin aprender de partidas humanas. Se espera que Ineffable Intelligence impulse algoritmos de planificación al estilo MuZero hacia dominios del mundo real como la ciencia de materiales, las matemáticas y la robótica, donde está disponible una retroalimentación de "verdad fundamental".
La formación de Ineffable Intelligence sugiere que la próxima batalla por la supremacía de la IA no se librará por quién tenga el mayor corpus de texto, sino por quién pueda construir los entornos más efectivos para que los agentes aprendan.
La salida de David Silver representa más que un simple cambio de personal; sirve como una declaración de intenciones para el futuro del campo. Al apostar por Ineffable Intelligence, Silver está apostando a que el camino hacia la superinteligencia no pasa por leer todo internet, sino por experimentar el mundo —simulado o real— y aprender a dominarlo una recompensa a la vez. A medida que el ciclo de exageración de la IA madura, la industria observará de cerca para ver si el aprendizaje por refuerzo puede ofrecer las capacidades de razonamiento que los modelos de lenguaje han prometido pero aún no han alcanzado por completo.