AI News

David Silver, vétéran de DeepMind, lève un cycle d'amorçage d'un milliard de dollars pour construire une superintelligence sans LLM

Dans ce qui signale un changement de paradigme potentiel dans la quête de l'intelligence artificielle générale(Artificial General Intelligence, AGI), David Silver, le chercheur renommé derrière AlphaGo et AlphaZero, lèverait un cycle d'amorçage historique d'un milliard de dollars pour sa nouvelle entreprise, Ineffable Intelligence. La startup basée à Londres, sortant de l'ombre avec une valorisation d'environ 4 milliards de dollars, parie contre la fixation actuelle de l'industrie sur les grands modèles de langage(Large Language Models, LLMs), visant plutôt à atteindre la superintelligence par le biais d'un pur apprentissage par renforcement(Reinforcement Learning).

Le cycle est mené par Sequoia Capital, avec des discussions de participation qui seraient en cours avec des géants technologiques tels que Nvidia, Google et Microsoft. S'il est conclu, cet accord constituerait le plus important cycle de financement d'amorçage de l'histoire du secteur technologique européen, soulignant le poids immense que les investisseurs accordent au palmarès de Silver et à sa thèse à contre-courant pour l'avenir de l'IA.

Un pari d'un milliard de dollars sur l'intuition « ineffable »

L'ampleur même de l'injection de capitaux — 1 milliard de dollars pour une entreprise qui n'a pas encore commercialisé de produit — reflète l'escalade des enjeux dans la course mondiale aux armements de l'IA. Alors que les cycles de plusieurs milliards de dollars sont devenus courants pour des acteurs établis comme OpenAI et Anthropic, un cycle d'amorçage de cette taille est sans précédent. Cela suggère que les investisseurs en capital-risque se préparent à une divergence de développement de l'IA intensive en capital, qui va au-delà de la simple mise à l'échelle des modèles basés sur le texte.

Ineffable Intelligence a son siège social à Londres, une décision qui renforce considérablement la position du Royaume-Uni en tant que hub critique pour la recherche de pointe en IA. Des sources proches de l'accord indiquent que les partenaires de Sequoia, Alfred Lin et Sonya Huang, se sont rendus personnellement à Londres pour conclure l'affaire, soulignant la concurrence féroce entre les investisseurs pour soutenir les talents techniques de premier plan quittant les grands laboratoires comme Google DeepMind.

La thèse : l'expérience plutôt que l'imitation

La réputation de David Silver repose sur un historique spécifique et puissant : il a construit les systèmes qui ont accompli ce que l'on pensait auparavant impossible. En tant que chercheur principal pour AlphaGo, il a vu sa création démanteler le champion du monde 18 fois, Lee Sedol, en 2016. Il a ensuite surpassé cet exploit avec AlphaZero, qui a maîtrisé le Go, les Échecs et le Shogi sans aucune donnée humaine, en apprenant uniquement par l'auto-apprentissage (self-play).

Cet historique constitue le socle intellectuel d'Ineffable Intelligence. L'argument central de Silver est que la norme actuelle de l'industrie — les LLM comme GPT-4 et Gemini — est fondamentalement limitée parce qu'elle repose sur l'imitation des données humaines. Étant donné que les LLM sont entraînés sur le texte d'Internet, ils sont bornés par la connaissance collective et les erreurs de raisonnement de l'humanité. Ils peuvent approximer l'intelligence, mais ils ne peuvent pas facilement transcender les capacités humaines.

Ineffable Intelligence postule que la véritable superintelligence nécessite l'apprentissage par renforcement. Dans ce paradigme, les agents n'apprennent pas en lisant sur le monde, mais en interagissant avec lui — en proposant des actions, en observant les conséquences et en mettant à jour leurs stratégies en fonction des récompenses. Cette méthode, souvent décrite comme la pensée de « Système 2 » ou la « recherche », permet à une IA de découvrir des solutions novatrices que les humains pourraient ne jamais concevoir, à l'instar d'AlphaGo jouant le « Coup 37 » — un coup qu'aucun joueur humain n'aurait joué, et qui a pourtant assuré la victoire.

Tableau : Chemins divergents vers la superintelligence

Le tableau ci-dessous présente les différences fondamentales entre l'approche dominante des LLM et la méthodologie de Silver axée sur l'apprentissage par renforcement.

Caractéristique Grands modèles de langage (LLMs) Apprentissage par renforcement (RL)
Source de données principale Jeux de données statiques (texte Internet, livres) Expérience dynamique (simulation, auto-apprentissage)
Mécanisme d'apprentissage Reconnaissance de motifs et prédiction du prochain jeton Essais et erreurs avec rétroaction par récompense
Plafond de capacité Limité à la somme des connaissances humaines Théoriquement illimité ; peut dépasser les limites humaines
Style de raisonnement Intuitif, « Système 1 » (Rapide) Délibératif, « Système 2 » (Lent, basé sur la recherche)
Faiblesse principale Hallucinations, manque d'ancrage réel Coût de calcul, difficulté dans les environnements ouverts

L'« Ère de l'expérience »

Silver a déjà articulé cette vision dans les cercles académiques, en co-écrivant un article intitulé « Era of Experience » avec un autre pionnier de l'apprentissage par renforcement, Richard Sutton. Ils soutenaient que le prochain saut de l'IA ne viendra pas de l'alimentation des modèles avec plus de jetons, mais d'agents qui « auto-découvrent les fondements de toutes les connaissances ».

Le défi pour Ineffable Intelligence sera d'appliquer le succès d'AlphaZero — qui opérait dans les environnements clos et à information parfaite des jeux de plateau — à la complexité désordonnée et ouverte du monde réel. C'est probablement pourquoi les besoins en capitaux sont si élevés. Construire des « modèles du monde » ou des simulations suffisamment robustes pour entraîner des agents d'apprentissage par renforcement à usage général nécessite des ressources de calcul massives, rivalisant avec les coûts d'infrastructure de l'entraînement des plus grands LLM.

L'exode des architectes

Le départ de Silver de Google DeepMind s'inscrit dans une tendance plus large de départs de haut niveau des laboratoires d'IA établis. À mesure que la bureaucratie croît au sein des géants corporatifs, les scientifiques qui ont construit les technologies fondatrices s'en détachent pour poursuivre des visions singulières et sans compromis de l'AGI.

Ce mouvement a créé une nouvelle classe de startups « Super-Seed » — des entreprises fondées par des sommités de l'IA qui contournent les étapes traditionnelles du capital-risque, levant immédiatement des milliards pour acquérir les clusters de calcul nécessaires.

Tableau : La nouvelle frontière des spin-offs de l'IA

Le tableau suivant compare Ineffable Intelligence avec d'autres entreprises de haut niveau dirigées par d'anciens chercheurs des Big Tech.

Startup|Fondateur(s)|Laboratoire d'origine|Philosophie centrale
---|---|----
Ineffable Intelligence|David Silver|Google DeepMind|Apprentissage par renforcement pur (surhumain)
Safe Superintelligence (SSI)|Ilya Sutskever|OpenAI|Mise à l'échelle privilégiant la sécurité vers l'AGI
Thinking Machines Lab|Mira Murati|OpenAI|Produits et recherche en IA avancée
xAI|Elon Musk|Divers|Recherche de la vérité, curiosité maximale

Implications pour le marché et perspectives d'avenir

Le lancement d'Ineffable Intelligence exerce une pression immense sur les leaders actuels du domaine de l'IA. Si Silver a raison, les rendements décroissants de la mise à l'échelle des LLM deviendront bientôt apparents, et l'industrie pourrait pivoter agressivement vers des approches basées sur l'apprentissage par renforcement. Cela validerait les « lois de mise à l'échelle »(scaling laws) du calcul dans une direction différente — non pas pour traiter du texte, mais pour simuler l'expérience.

Pour l'Europe, c'est un moment charnière. Retenir un talent comme Silver et obtenir un investissement d'un milliard de dollars pour une entité basée à Londres contrebalance le récit selon lequel tout le développement de pointe de l'IA est destiné à San Francisco.

Cependant, le chemin à parcourir est semé de risques techniques. L'apprentissage par renforcement est notoirement difficile à stabiliser en dehors des environnements de jeu. Si Ineffable Intelligence réussit, elle ne construira pas seulement un meilleur chatbot ; elle construira un système capable de découverte scientifique indépendante et de planification stratégique dépassant les limites cognitives humaines. Si elle échoue, ce sera l'une des expériences les plus coûteuses de l'histoire de l'informatique.

Alors que les négociations pour le cycle de financement se finalisent, l'implication de soutiens stratégiques comme Nvidia suggère que l'infrastructure matérielle est déjà en cours d'alignement pour soutenir la vision de Silver. La course à l'AGI s'est effectivement divisée en deux voies : ceux qui lisent Internet pour apprendre comment les humains pensent, et ceux qui jouent des parties contre eux-mêmes pour apprendre à penser mieux que les humains ne le pourront jamais.

Vedettes