
In einem bahnbrechenden Umbruch in der Landschaft der künstlichen Intelligenz hat David Silver, der leitende Forschungswissenschaftler hinter AlphaGo und eine Schlüsselfigur bei Google DeepMind, seinen Abschied angekündigt, um ein neues unabhängiges Unternehmen, Ineffable Intelligence, zu gründen. Der am Freitag bestätigte Schritt ist der jüngste hochkarätige Abgang aus einem großen Tech-Konzern und signalisiert eine wachsende Branchenverlagerung von Generative KI (Generative AI) hin zur Verfolgung autonomer, zielgerichteter Superintelligenz.
Silver, weithin als der "Vater von AlphaGo" angesehen, verbrachte über ein Jahrzehnt bei DeepMind, wo seine Arbeit am Verstärkungslernen (Reinforcement Learning, RL) die Entwicklung des Fachgebiets grundlegend veränderte. Sein neues Startup hat das Ziel, die derzeitige Branchenbesessenheit mit Large Language Models (LLMs) zu umgehen und stattdessen stärker der Philosophie der "Alberta School" zu folgen: dass ein Agent, der durch Interaktion und Belohnung lernt, der einzige gangbare Weg zur Erreichung wahrer Allgemeiner Künstlicher Intelligenz (Artificial General Intelligence, AGI) ist.
Der Name von Silvers neuem Labor, Ineffable Intelligence, stellt eine direkte philosophische Herausforderung an den Status quo dar. Während der derzeitige KI-Boom von Systemen angetrieben wird, die die menschliche Sprache meistern — indem sie probabilistisch das nächste Wort in einer Sequenz vorhersagen — postuliert Silvers These, dass die wichtigsten Aspekte von Intelligenz "unaussprechlich" sind, also nicht allein durch Sprache erfassbar.
„Sprache ist eine Kompression von Erfahrung, nicht die Erfahrung selbst“, sagte Silver in einer Pressekonferenz nach der Ankündigung. „Um Superintelligenz zu erreichen, müssen wir Agenten bauen, die von Grund auf durch Versuch, Irrtum und Entdeckung lernen, ähnlich wie AlphaZero. Wir bewegen uns weg von der Ära statischer Datensätze hin zur Ära unendlicher Erfahrung.“
Das Startup beabsichtigt, sich ausschließlich auf Verstärkungslernen (RL)-Agenten zu konzentrieren, die zu langfristiger Planung und neuartigen wissenschaftlichen Entdeckungen fähig sind, statt auf Chatbots oder generative Medien. Dies steht im Einklang mit Silvers bekanntem Papier von 2021, Reward is Enough, das argumentierte, dass Belohnungsmaximierung ausreichend ist, um das Entstehen allen intelligenten Verhaltens zu erklären.
Silvers Weggang ist Teil eines breiteren "Neolab"-Phänomens, bei dem Spitzenforscher etablierte Unternehmenslabore verlassen, um agile, missionsgetriebene Startups zu gründen. Dieser Trend spiegelt eine Fragmentierung in der KI-Gemeinschaft hinsichtlich des besten Weges nach vorne wider. Während Unternehmen wie OpenAI und Google auf das Skalieren von Transformern setzen, setzen Forscher wie Silver (und der ehemalige Chief Scientist von OpenAI, Ilya Sutskever) auf alternative Architekturen.
Ineffable Intelligence reiht sich in eine wachsende Kohorte elitärer Forschungslabore in London und San Francisco ein, die darauf abzielen, die derzeitigen Engpässe bei Schlussfolgerung und Zuverlässigkeit, unter denen LLMs leiden, zu lösen.
Tabelle: Die strategische Kluft in der modernen KI-Entwicklung
| Feature | Generative KI (LLMs) | Verstärkungslernen (RL) |
|---|---|---|
| Kernziel | Das nächste Token in einer Sequenz vorhersagen | Die kumulative zukünftige Belohnung maximieren |
| Lernquelle | Statische Datensätze (Internettexte/-bilder) | Dynamische Interaktion mit Umgebungen |
| Fähigkeiten | Zusammenfassung, Übersetzung, Inhaltsgenerierung | Planung, Strategie, neuartige Entdeckungen |
| Einschränkungen | Halluzinationen, fehlende echte Verankerung | Hohe Rechenkosten für Simulationen |
| Hauptziel | Menschenähnliche Nachahmung | Übermenschliche Optimierung |
David Silvers Ansatz ist tief in der "Alberta School" der KI verwurzelt, die von seinem Mentor Richard Sutton beeinflusst wurde. Diese Denkschule priorisiert „rechnerisch skalierbare“ Methoden, die nicht auf menschlich gelabelten Daten beruhen.
Während seiner Zeit bei Google DeepMind wandte Silver diese Prinzipien an, um AlphaGo zu entwickeln, das 2016 die Welt überraschte, als es Weltmeister Lee Sedol besiegte, und anschließend AlphaZero und MuZero, die Schach, Shogi und Go beherrschten, ohne von menschlichen Partien zu lernen. Es wird erwartet, dass Ineffable Intelligence MuZero-ähnliche Planungsalgorithmen in reale Domänen wie Materialwissenschaften, Mathematik und Robotik vorantreibt, wo Feedback in Form von „Ground Truth“ verfügbar ist.
Die Gründung von Ineffable Intelligence deutet darauf hin, dass die nächste Kampfzone um die Vorherrschaft in der KI nicht mehr darüber geführt wird, wer das größte Textkorpus besitzt, sondern wer die effektivsten Umgebungen schafft, in denen Agenten lernen können.
David Silvers Abschied ist mehr als nur eine Personalveränderung; er ist eine Absichtserklärung für die Zukunft des Feldes. Mit der Wette auf Ineffable Intelligence setzt Silver darauf, dass der Weg zur Superintelligenz nicht darin liegt, das gesamte Internet zu lesen, sondern die Welt — simuliert oder real — zu erfahren und sie eine Belohnung nach der anderen zu meistern. Während der KI-Hypezyklus reift, wird die Branche genau beobachten, ob Verstärkungslernen die Schlussfolgerungsfähigkeiten liefern kann, die Sprachmodelle versprochen, aber noch nicht vollständig erreicht haben.