AI News

Una nueva era para la IA: David Silver abandona DeepMind para perseguir la superinteligencia "Ineffable"

En un cambio sísmico para el panorama de la inteligencia artificial, David Silver, el principal científico investigador detrás de AlphaGo y una figura fundamental en Google DeepMind, ha anunciado su salida para lanzar una nueva iniciativa independiente, Ineffable Intelligence. El movimiento, confirmado el viernes, marca la más reciente salida de alto perfil de un gigante tecnológico y señala un creciente giro de la industria desde la Inteligencia Generativa (Generative AI) hacia la búsqueda de una superinteligencia autónoma y orientada a objetivos.

Silver, ampliamente considerado el "padre de AlphaGo", pasó más de una década en DeepMind, donde su trabajo en aprendizaje por refuerzo (Reinforcement Learning, RL) cambió fundamentalmente la trayectoria del campo. Su nueva startup pretende eludir la actual obsesión de la industria con Modelos de Lenguaje a Gran Escala (Large Language Models, LLMs), apostando en su lugar por la filosofía de la "Alberta School": que un agente que aprende a partir de la interacción y la recompensa es la única vía viable hacia la Inteligencia Artificial General (Artificial General Intelligence).

Los límites del lenguaje y el auge de Ineffable Intelligence

El nombre del nuevo laboratorio de Silver, Ineffable Intelligence, sirve como un desafío filosófico directo al status quo. Mientras que el actual auge de la IA está impulsado por sistemas que dominan el lenguaje humano —prediciendo probabilísticamente la siguiente palabra en una secuencia— la tesis de Silver postula que los aspectos más críticos de la inteligencia son "inefables", o imposibles de capturar solo mediante el lenguaje.

"El lenguaje es una compresión de la experiencia, no la experiencia misma", declaró Silver en una rueda de prensa tras el anuncio. "Para alcanzar la superinteligencia, debemos construir agentes que aprendan desde cero mediante ensayo, error y descubrimiento, tal como hizo AlphaZero. Estamos avanzando más allá de la era de los conjuntos de datos estáticos hacia la era de la experiencia infinita."

La startup tiene la intención de centrarse exclusivamente en Aprendizaje por refuerzo (RL) capaz de planificación a largo plazo y descubrimiento científico novedoso, en lugar de chatbots o medios generativos. Esto se alinea con el famoso artículo de Silver de 2021, Reward is Enough, que argumentaba que la maximización de la recompensa es suficiente para explicar la aparición de todo comportamiento inteligente.

Caminos divergentes: la tendencia "neolab"

La salida de Silver forma parte de un fenómeno más amplio de "neolab", en el que investigadores de primer nivel abandonan laboratorios corporativos consolidados para fundar startups ágiles y orientadas a una misión. Esta tendencia refleja una fragmentación en la comunidad de IA sobre la mejor vía a seguir. Mientras compañías como OpenAI y Google se centran en escalar transformadores, investigadores como Silver (y el ex científico jefe de OpenAI Ilya Sutskever) están apostando por arquitecturas alternativas.

Ineffable Intelligence se une a una cohorte creciente de laboratorios de investigación de élite emergentes en Londres y San Francisco, con el objetivo de resolver los cuellos de botella de razonamiento y fiabilidad que actualmente afectan a los LLMs.

Table: The Strategic Divide in Modern AI Development

Feature Generative AI (LLMs) Reinforcement Learning (RL)
Core Objective Predecir el siguiente token en una secuencia Maximizar la recompensa futura acumulada
Learning Source Conjuntos de datos estáticos (texto/imágenes de internet) Interacción dinámica con entornos
Capabilities Resumen, traducción, creación de contenido Planificación, estrategia, descubrimiento novedoso
Limitations Alucinaciones, falta de verdadero anclaje Alto coste computacional para la simulación
Primary Goal Imitación humana Optimización sobrehumana

La influencia de la Alberta School

David Silver’s approach is deeply rooted in the "Alberta School" of AI, influenced by his mentor, Richard Sutton. Esta corriente de pensamiento prioriza métodos "computacionalmente escalables" que no dependen de datos etiquetados por humanos.

Durante su etapa en Google DeepMind, Silver aplicó estos principios para crear AlphaGo, que sorprendió al mundo en 2016 al derrotar al campeón mundial Lee Sedol, y posteriormente AlphaZero y MuZero, que dominaron el ajedrez, el shogi y el go sin aprender de partidas humanas. Se espera que Ineffable Intelligence impulse algoritmos de planificación al estilo MuZero hacia dominios del mundo real como la ciencia de materiales, las matemáticas y la robótica, donde está disponible una retroalimentación de "verdad fundamental".

Implicaciones para la industria

La formación de Ineffable Intelligence sugiere que la próxima batalla por la supremacía de la IA no se librará por quién tenga el mayor corpus de texto, sino por quién pueda construir los entornos más efectivos para que los agentes aprendan.

  • Cambio hacia el pensamiento "Sistema 2": Mientras que los LLMs sobresalen en el pensamiento de "Sistema 1" (respuestas rápidas e intuitivas), el enfoque de RL de Silver apunta al pensamiento de "Sistema 2" (razonamiento y búsqueda lentos y deliberados), que es esencial para resolver problemas complejos de ingeniería o medicina.
  • Solución al muro de datos: A medida que la industria advierte sobre quedarse sin datos textuales humanos de alta calidad para entrenar modelos, los agentes de RL ofrecen una solución: generan sus propios datos mediante auto-juego y simulación, lo que teóricamente permite una escalabilidad infinita.
  • Migración de talento: Se espera que la reputación de Silver atraiga a un número significativo de especialistas en RL de grandes laboratorios, potencialmente desatando una guerra por el talento entre investigadores expertos en teoría de la decisión y sistemas de control.

Conclusión

La salida de David Silver representa más que un simple cambio de personal; sirve como una declaración de intenciones para el futuro del campo. Al apostar por Ineffable Intelligence, Silver está apostando a que el camino hacia la superinteligencia no pasa por leer todo internet, sino por experimentar el mundo —simulado o real— y aprender a dominarlo una recompensa a la vez. A medida que el ciclo de exageración de la IA madura, la industria observará de cerca para ver si el aprendizaje por refuerzo puede ofrecer las capacidades de razonamiento que los modelos de lenguaje han prometido pero aún no han alcanzado por completo.

Destacados