AI News

El veterano de DeepMind David Silver recauda una ronda semilla de 1000 millones de dólares para construir superinteligencia sin LLM

En un movimiento que señala un posible cambio de paradigma en la búsqueda de la Inteligencia Artificial General (Artificial General Intelligence, AGI), David Silver, el renombrado investigador detrás de AlphaGo y AlphaZero, está recaudando según informes una histórica ronda semilla de 1000 millones de dólares para su nueva empresa, Ineffable Intelligence. La startup con sede en Londres, que surge del sigilo con una valoración de aproximadamente 4000 millones de dólares, está apostando contra la fijación actual de la industria en los Modelos de Lenguaje Extensos (Large Language Models, LLMs), con el objetivo de lograr la superinteligencia a través de aprendizaje por refuerzo puro.

La ronda está siendo liderada por Sequoia Capital, con discusiones de participación supuestamente en curso con gigantes tecnológicos como Nvidia, Google y Microsoft. Si se completa, este acuerdo se posicionaría como la mayor ronda de financiación semilla en la historia del sector tecnológico europeo, subrayando el inmenso peso que los inversores otorgan a la trayectoria de Silver y su tesis contraria sobre el futuro de la IA.

Una apuesta de mil millones de dólares en la intuición "inefable"

La magnitud de la inyección de capital —1000 millones de dólares para una empresa que aún no ha lanzado un producto— refleja la escalada de las apuestas en la carrera armamentista global de la IA. Si bien las rondas de miles de millones de dólares se han vuelto comunes para actores establecidos como OpenAI y Anthropic, una ronda semilla de este tamaño no tiene precedentes. Esto sugiere que los capitalistas de riesgo se están preparando para una divergencia de desarrollo de IA intensiva en capital, una que va más allá de simplemente escalar modelos basados en texto.

Ineffable Intelligence tiene su sede en Londres, una decisión que refuerza significativamente la posición del Reino Unido como un centro crítico para la investigación de IA de vanguardia. Fuentes cercanas al acuerdo indican que los socios de Sequoia, Alfred Lin y Sonya Huang, viajaron personalmente a Londres para asegurar el trato, destacando la feroz competencia entre los capitalistas de riesgo para respaldar al talento técnico de primer nivel que sale de laboratorios importantes como Google DeepMind.

La tesis: Experiencia sobre imitación

La reputación de David Silver se basa en una historia específica y poderosa: construyó los sistemas que lograron lo que anteriormente se consideraba imposible. Como investigador principal de AlphaGo, vio a su creación derrotar al 18 veces campeón mundial Lee Sedol en 2016. Luego superó ese logro con AlphaZero, que dominó el Go, el Ajedrez y el Shogi sin ningún dato humano, aprendiendo únicamente a través del autoaprendizaje.

Esta historia forma la base intelectual de Ineffable Intelligence. El argumento central de Silver es que el estándar actual de la industria —LLMs como GPT-4 y Gemini— está fundamentalmente limitado porque depende de la imitación de datos humanos. Dado que los LLMs se entrenan con el texto de internet, están limitados por el conocimiento colectivo y los errores de razonamiento de la humanidad. Pueden aproximarse a la inteligencia, pero no pueden trascender fácilmente la capacidad humana.

Ineffable Intelligence postula que la verdadera superinteligencia requiere Aprendizaje por Refuerzo (Reinforcement Learning, RL). En este paradigma, los agentes aprenden no leyendo sobre el mundo, sino interactuando con él: proponiendo acciones, observando consecuencias y actualizando sus estrategias basadas en recompensas. Este método, a menudo descrito como pensamiento de "Sistema 2" o "búsqueda", permite que una IA descubra soluciones novedosas que los humanos tal vez nunca conciban, de manera muy similar a como AlphaGo jugó el Movimiento 37, un movimiento que ningún jugador humano habría hecho, pero que aseguró la victoria.

Tabla: Caminos divergentes hacia la superinteligencia

La siguiente tabla describe las diferencias fundamentales entre el enfoque predominante de LLM y la metodología de Silver centrada en RL.

Característica Modelos de Lenguaje Extensos (LLMs) Aprendizaje por Refuerzo (RL)
Fuente de datos primaria Conjuntos de datos estáticos (texto de internet, libros) Experiencia dinámica (Simulación, Autoaprendizaje)
Mecanismo de aprendizaje Emparejamiento de patrones y predicción del siguiente token Ensayo y error con retroalimentación de recompensa
Techo de capacidad Limitado a la suma del conocimiento humano Teóricamente sin límite; puede superar los límites humanos
Estilo de razonamiento Intuitivo, "Sistema 1" (Rápido) Deliberativo, "Sistema 2" (Lento, basado en búsqueda)
Debilidad principal Alucinaciones, falta de base real Coste computacional, dificultad en entornos abiertos

La "Era de la Experiencia"

Silver ha articulado previamente esta visión en círculos académicos, siendo coautor de un artículo titulado "Era of Experience" con el también pionero del RL Richard Sutton. Argumentaron que el próximo salto en la IA no vendrá de alimentar a los modelos con más tokens, sino de agentes que "autodescubran los fundamentos de todo el conocimiento".

El desafío para Ineffable Intelligence será aplicar el éxito de AlphaZero —que operaba en entornos cerrados de información perfecta como los juegos de mesa— a la complejidad desordenada y abierta del mundo real. Es probable que por esto los requisitos de capital sean tan altos. Construir "modelos de mundo" o simulaciones lo suficientemente robustas para entrenar agentes de RL de propósito general requiere recursos de computación masivos, rivalizando con los costes de infraestructura de entrenar los LLMs más grandes.

El éxodo de los arquitectos

La salida de Silver de Google DeepMind es parte de una tendencia más amplia de salidas de alto perfil de laboratorios de IA establecidos. A medida que la burocracia crece dentro de los gigantes corporativos, los científicos que construyeron las tecnologías fundamentales se están independizando para perseguir visiones singulares y sin compromisos de la AGI.

Este movimiento ha creado una nueva clase de startups "Super-Semilla": empresas fundadas por luminarias de la IA que omiten las etapas tradicionales de riesgo, recaudando miles de millones de inmediato para adquirir los clústeres de computación necesarios.

Tabla: La nueva frontera de las "spinoffs" de IA

La siguiente tabla compara a Ineffable Intelligence con otras empresas de alto perfil lideradas por antiguos investigadores de grandes tecnológicas.

Startup Fundador(es) Laboratorio de origen Filosofía central
Ineffable Intelligence David Silver Google DeepMind Aprendizaje por Refuerzo puro (Sobrehumano)
Safe Superintelligence (SSI) Ilya Sutskever OpenAI Escalamiento priorizando la seguridad hacia la AGI
Thinking Machines Lab Mira Murati OpenAI Investigación y productos de IA avanzada
xAI Elon Musk Varios Búsqueda de la verdad, curiosidad máxima

Implicaciones de mercado y perspectivas futuras

El lanzamiento de Ineffable Intelligence ejerce una presión inmensa sobre los líderes actuales del campo de la IA. Si Silver tiene razón, los rendimientos decrecientes de escalar los LLMs pronto se harán evidentes, y la industria podría pivotar agresivamente hacia enfoques basados en RL. Esto validaría las "leyes de escalamiento" de la computación en una dirección diferente: no para procesar texto, sino para simular experiencia.

Para Europa, este es un momento decisivo. Retener un talento como Silver y asegurar una inversión de 1000 millones de dólares para una entidad con sede en Londres contradice la narrativa de que todo el desarrollo de IA de vanguardia está destinado a San Francisco.

Sin embargo, el camino por delante está lleno de riesgos técnicos. El aprendizaje por refuerzo es notoriamente difícil de estabilizar fuera de los entornos de juego. Si Ineffable Intelligence tiene éxito, no solo construirá un mejor chatbot; construirá un sistema capaz de descubrimientos científicos independientes y planificación estratégica que exceda los límites cognitivos humanos. Si falla, será uno de los experimentos más caros en la historia de la informática.

A medida que finalizan las negociaciones para la ronda, la participación de patrocinadores estratégicos como Nvidia sugiere que la infraestructura de hardware ya se está alineando para respaldar la visión de Silver. La carrera por la AGI se ha dividido efectivamente en dos carriles: aquellos que leen internet para aprender cómo piensan los humanos, y aquellos que juegan partidas contra sí mismos para aprender a pensar mejor de lo que los humanos podrían hacerlo jamás.

Destacados