AI News

DeepMind-CEO stellt OpenAIs Strategie in Frage, plädiert für „Weltmodelle (World Models)“

In einem richtungsweisenden Moment für die Branche der künstlichen Intelligenz (artificial intelligence industry) hat der CEO von Google DeepMind, Demis Hassabis, öffentlich die vorherrschende Dominanz der Großen Sprachmodelle (Large Language Models, LLMs) infrage gestellt und argumentiert, dass der derzeit von Wettbewerbern wie OpenAI bevorzugte Weg nicht ausreiche, um echte Allgemeine Künstliche Intelligenz (Artificial General Intelligence, AGI) zu erreichen. In der Sendung „The Tech Download“ des Senders CNBC am 19. Januar 2026 erläuterte Hassabis eine strategische Kehrtwende hin zu „Weltmodellen (World Models)“, Systemen, die in der Lage sind, die physische Realität zu simulieren und Kausalität zu verstehen, statt lediglich Text anhand statistischer Korrelationen vorherzusagen.

Diese Kritik markiert eine bedeutende Abweichung in den philosophischen und technischen Fahrplänen der weltweit führenden KI‑Labore. Während OpenAI unter der Leitung von Sam Altman historisch auf Skalierungsgesetze gesetzt hat — die Idee, dass steigende Rechenleistung und Datenmengen zwangsläufig zu höherer Intelligenz führen — schlägt Hassabis vor, dass dieser Ansatz beim wissenschaftlichen Erfinden und dem Schlussfolgern aus ersten Prinzipien an eine „grundlegende Wand“ gestoßen sei.

Die Begrenzung der textbasierten Skalierung

Der Kern von Hassabis' Argument beruht auf der Unterscheidung zwischen Informationsverarbeitung und physischem Verständnis. LLMs, wie die GPT‑Serie, sind hervorragend darin, große Mengen menschlich erzeugten Textes zu analysieren, um Muster zu finden. Hassabis behauptet jedoch, dass diese Modelle „Kausalität nicht wirklich verstehen“. Sie können einen fallenden Apfel anhand von Beschreibungen in ihren Trainingsdaten beschreiben, aber sie können die Physik der Schwerkraft in einer neuen Umgebung nicht simulieren, um ein Ergebnis vorherzusagen, das sie zuvor nicht gesehen haben.

„Die heutigen großen Sprachmodelle sind phänomenal im Mustererkennen“, sagte Hassabis im Interview. „Aber sie wissen nicht wirklich, warum A zu B führt. Sie sagen nur das nächste Token voraus.“

Für Creati.ai‑Leser ist diese Unterscheidung entscheidend. Sie impliziert, dass LLMs sich zwar weiterhin als Konversationsschnittstellen und Programmierassistenten verbessern werden, aber möglicherweise unfähig bleiben, die Art von „Durchbrüchen im AlphaGo‑Maßstab“ zu erzielen, die nötig sind, um komplexe wissenschaftliche Probleme zu lösen, wie neue Materialien zu entdecken oder Krankheiten zu heilen. Hassabis schätzt, dass AGI noch 5 bis 10 Jahre entfernt ist und Architekturen erfordern wird, die über das derzeitige transformer‑basierte Paradigma hinausgehen.

Definition des „Weltmodells“

DeepMinds alternative Vision konzentriert sich darauf, KI zu schaffen, die eine interne Repräsentation der physischen Welt aufbaut. Diese „Weltmodelle (World Models)“ funktionieren weniger wie eine Bibliothek und mehr wie eine Spiel-Engine. Sie können „Gedankenexperimente“ durchführen, Ergebnisse im 3D‑Raum simulieren und Hypothesen gegen ein konsistentes Set physikalischer Gesetze testen.

DeepMind hat bereits begonnen, die Praktikabilität dieses Ansatzes zu demonstrieren. Hassabis verwies auf Genie 3, ein System, das im August 2025 veröffentlicht wurde und interaktive 3D‑Umgebungen aus Textaufforderungen erzeugt, und SIMA 2, das KI‑Agenten darin trainiert, sich in diesen simulierten Welten zu orientieren und Aufgaben auszuführen. Frühe Forschungen deuten darauf hin, dass diese hybriden Systeme — die Sprachverständnis mit räumlichem Denken kombinieren — in komplexen Denkaufgaben um 20–30 % besser abschneiden als reine LLMs und Halluzinationen bezüglich grundlegender Physik deutlich reduzieren.

Strategische Divergenz: Google vs. OpenAI

Das Timing dieser Äußerungen ist kein Zufall. Die KI‑Branche durchläuft derzeit eine Phase starker Volatilität. Nach dem Start von Googles Gemini 3 Ende 2025 tauchten Berichte über einen internen „Code Red“ bei OpenAI auf, ausgelöst durch Befürchtungen, dass deren Skalierungsstrategie abnehmende Erträge liefere. Indem Hassabis öffentlich die Grenzen des reinen‑LLM‑Pfads darlegt, positioniert er Google nicht nur als Wettbewerber, sondern als Wegbereiter des nächsten architektonischen Sprungs in der KI.

Dieser Wandel ist sowohl operativ als auch philosophisch. Hassabis gab bekannt, dass er jetzt täglich mit Alphabet‑CEO Sundar Pichai in Kontakt steht, eine Änderung, die DeepMinds erhöhten Status als die zentrale „Motor‑Werkstatt“ von Googles KI‑Bestrebungen unterstreicht. Diese schlankere Struktur zielt darauf ab, die Übersetzung von Forschungsdurchbrüchen in Konsumentenprodukte zu beschleunigen — eine direkte Antwort auf die Kritik, Google habe zuvor zu langsam gehandelt.

Der geopolitische Kontext: China holt auf

Über die technische Debatte hinaus gab Hassabis eine ernüchternde Einschätzung der globalen KI‑Landschaft. Auf die Frage nach internationaler Konkurrenz bemerkte er, dass chinesische KI‑Modelle schnell die Leistungslücke zu westlichen Pendanten schließen.

„Es ist eine Frage von Monaten, nicht von Jahren“, sagte Hassabis in Bezug auf den Rückstand zwischen US‑ und chinesischen Vorreiter‑Modellen. Er nannte schnelle Fortschritte von Unternehmen wie Alibaba und Startups wie Moonshot AI. Gleichzeitig zog er eine nuancierte Unterscheidung: Während chinesische Labore beim schnellen Nachziehen und bei ingenieurtechnischer Exzellenz sehr geschickt seien, stellte Hassabis infrage, ob das aktuelle Ökosystem in China die spezifische „Denkweise“ fördere, die für null‑auf‑eins‑wissenschaftliche Durchbrüche nötig ist, wie etwa die ursprüngliche Erfindung der Transformer‑Architektur durch Google‑Forscher.

Vergleichsanalyse: LLMs vs. Weltmodelle

Um die Einsatzfragen dieser architektonischen Debatte zu verstehen, ist es hilfreich, die Fähigkeiten und Grenzen der beiden dominierenden Ansätze gegenüberzustellen, die derzeit um Ressourcen konkurrieren.

Comparison of Large Language Models and World Models

Feature Große Sprachmodelle (Large Language Models, LLMs) Weltmodelle (World Models)
Core Mechanism Statistische Mustererkennung und Token‑Vorhersage Simulation der physischen Realität und Kausalität
Primary Data Source Text, Code und statische Bilder aus dem Internet 3D‑Umgebungen, Physik‑Engines und Videodaten
Reasoning Capability Korrelativ (assoziative Logik) Kausal (Schlussfolgern aus ersten Prinzipien)
Key Limitation Halluzinationen und fehlendes räumliches Bewusstsein Hohe Rechenkosten für Echtzeitsimulation
Ideal Use Case Kreatives Schreiben, Programmierung, Zusammenfassungen Robotik, wissenschaftliche Entdeckung, autonome Agenten
Example Systems GPT-4, Claude 3, Llama 3 Genie 3, SIMA 2, AlphaFold

Auswirkungen für die KI‑Branche

Hassabis' Befürwortung von Weltmodellen deutet auf einen breiteren Branchentrend hin zu „neuro‑symbolischen (neuro-symbolic)“ bzw. hybriden KI‑Systemen. Für Entwickler und Unternehmensleiter bedeutet das, dass die Ära, in der man sich allein auf Prompt‑Engineering (prompt engineering) für textbasierte Modelle verlässt, vermutlich in eine Phase übergeht, in der räumliches Computing (spatial computing) und Simulation zu kritischen Komponenten des KI‑Stacks werden.

Wenn sich DeepMinds Hypothese als richtig erweist, wird die nächste Generation von KI nicht nur über die Welt sprechen — sie wird sich in ihr zurechtfinden können. Diese Fähigkeit ist essentiell, um die physische Ökonomie zu erschließen, einschließlich fortschrittlicher Robotik und autonomer wissenschaftlicher Experimente. Während OpenAI weiterhin das „Gehirn“ der KI durch Sprache verfeinert, scheint DeepMind darauf abzuzielen, diesem Gehirn einen Körper und eine Welt zum Leben zu geben.

Im Laufe des Jahres 2026 wird die Branche voraussichtlich eine Bifurkation in der Modellentwicklung erleben: ein Pfad optimiert für sprachliche Flüssigkeit und ein anderer für physische Intelligenz. Für Creati.ai werden wir genau beobachten, wie diese Weltmodelle mit bestehenden generativen Werkzeugen integriert werden und möglicherweise eine neue Klasse von Anwendungen schaffen, die kreative Generierung mit wissenschaftlicher Genauigkeit verbinden.

Ausgewählt
ThumbnailCreator.com
KI-gestütztes Tool zur schnellen und einfachen Erstellung beeindruckender, professioneller YouTube-Vorschaubilder.
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AirMusic
AirMusic.ai erzeugt hochwertige KI-Musikstücke aus Textvorgaben mit Stil- und Stimmungsanpassung sowie Stem-Export.
AdsCreator.com
Erstellen Sie sofort aus jeder Website‑URL polierte, markenkonforme Werbemotive für Meta, Google und Stories.
Refly.ai
Refly.AI ermöglicht nicht‑technischen Kreativen, Arbeitsabläufe mit natürlicher Sprache und einer visuellen Leinwand zu automatisieren.
VoxDeck
KI-Präsentations-Tool, das die visuelle Revolution anführt
BGRemover
Entfernen Sie ganz einfach Hintergründe von Bildern online mit SharkFoto BGRemover.
Qoder
Qoder ist ein KI-gestützter Coding-Assistent, der Planung, Codierung und Tests für Softwareprojekte automatisiert.
FineVoice
Verwandle Text in Emotion — Klone, designe und erstelle ausdrucksstarke KI-Stimmen in Sekundenschnelle.
Flowith
Flowith ist ein Canvas-basierter agentischer Arbeitsbereich, der kostenloses 🍌Nano Banana Pro und andere effektive Model
Skywork.ai
Skywork AI ist ein innovatives Tool zur Steigerung der Produktivität mit KI.
FixArt AI
FixArt AI bietet kostenlose, uneingeschränkte KI-Tools zur Bild- und Videogenerierung ohne Anmeldung an.
Elser AI
All‑in‑one Web‑Studio, das Text und Bilder in Anime‑Kunst, Charaktere, Stimmen und Kurzfilme verwandelt.
Pippit
Steigern Sie Ihre Inhaltserstellung mit den leistungsstarken KI-Tools von Pippit!
SharkFoto
SharkFoto ist eine leistungsstarke All-in-One KI-Plattform zur effizienten Erstellung und Bearbeitung von Videos, Bildern und Musik.
Funy AI
Erwecke deine Fantasien zum Leben! Erstelle KI-Bikini- & Kuss-Videos aus Bildern/Text. Teste den KI-Kleidungswechsler. K
KiloClaw
Gehosteter OpenClaw-Agent: Ein-Klick-Bereitstellung, über 500 Modelle, sichere Infrastruktur und automatisiertes Agenten-Management für Teams und Entwickler.
Diagrimo
Diagrimo verwandelt Text sofort in anpassbare, KI-generierte Diagramme und Visuals.
SuperMaker AI Video Generator
Erstellen Sie mühelos atemberaubende Videos, Musik und Bilder mit SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer von SharkFoto ermöglicht es Ihnen, Outfits sofort virtuell anzuprobieren – mit realistischer Passform, Textur und Beleuchtung.
Yollo AI
Chatten & erstellen mit Ihrem KI-Begleiter. Bild-zu-Video & KI-Bildgenerator.
AnimeShorts
Erstellen Sie mühelos atemberaubende Anime-Kurzfilme mit modernster KI-Technologie.
Image to Video AI without Login
Kostenloses Image‑to‑Video‑KI‑Tool, das Fotos sofort in flüssige, hochwertige animierte Videos ohne Wasserzeichen verwandelt.
Anijam AI
Anijam ist eine KI-native Animationsplattform, die Ideen mithilfe agentischer Videoerstellung in ausgefeilte Geschichten verwandelt.
HappyHorseAIStudio
Browserbasierter KI-Videogenerator für Texte, Bilder, Referenzen und Videobearbeitung.
InstantChapters
Erstelle Kapitel für dein Youtube Video mit einem Klick. Keyword optimierte Timestamps verbessern SEO und Engagement.
NerdyTips
Eine KI-gestützte Fußball-Prognoseplattform, die datenbasierte Spieltipps für Ligen weltweit liefert.
WhatsApp AI Sales
WABot ist ein WhatsApp-AI-Vertriebs-Copilot, der Echtzeit-Skripte, Übersetzungen und Intent-Erkennung liefert.
happy horse AI
Open-Source-KI-Videogenerator, der synchronisiertes Video und Audio aus Text oder Bildern erstellt.
insmelo AI Music Generator
KI-gestützter Musikgenerator, der Eingabeaufforderungen, Songtexte oder Uploads in etwa einer Minute in fertige, lizenzfreie Songs verwandelt.
AI Video API: Seedance 2.0 Here
Einheitliche KI-Video-API, die Top-Generationsmodelle über einen einzigen Schlüssel zu geringeren Kosten anbietet.
wan 2.7-image
Ein steuerbarer KI-Bildgenerator für präzise Gesichter, Farbpaletten, Text und visuelle Kontinuität.
BeatMV
Webbasierte KI-Plattform, die Lieder in cineastische Musikvideos verwandelt und mit KI Musik erstellt.
Kirkify
Kirkify AI erstellt sofort virale Face-Swap-Memes mit charakteristischer Neon-Glitch-Ästhetik für Meme-Ersteller.
Text to Music
Verwandeln Sie Text oder Songtexte in vollständige, studio‑taugliche Songs mit KI-generierten Gesangsstimmen, Instrumenten und Multi‑Track‑Exports.
UNI-1 AI
UNI-1 ist ein einheitliches Bildgenerierungsmodell, das visuelle Schlussfolgerungen mit hochqualitativer Bildsynthese kombiniert.
Wan 2.7
Professionelles KI-Videomodell mit präziser Bewegungssteuerung und Multi-View-Konsistenz.
Iara Chat
Iara Chat: Ein KI-gestützter Produktivitäts- und Kommunikationsassistent.
Tome AI PPT
KI-gestützter Präsentations-Generator, der in Minuten professionelle Folien erstellt, verschönert und exportiert.
Lyria3 AI
KI-Musikgenerator, der sofort hochwertige, vollständig produzierte Songs aus Textvorgaben, Liedtexten und Stilvorgaben erstellt.
kinovi - Seedance 2.0 - Real Man AI Video
Kostenloser KI-Video-Generator mit realistisch wirkenden Menschen, ohne Wasserzeichen und mit vollständigen kommerziellen Nutzungsrechten.
Video Sora 2
Sora 2 AI verwandelt Text oder Bilder in kurze, physikalisch korrekte Social- und eCommerce-Videos in wenigen Minuten.
Atoms
KI‑gesteuerte Plattform, die mit Multi‑Agenten‑Automatisierung in Minuten Full‑Stack‑Apps und Websites erstellt — kein Programmieren erforderlich.
AI Pet Video Generator
Erstellen Sie virale, teilbare Haustier‑Videos aus Fotos mithilfe KI‑gestützter Vorlagen und sofortigem HD‑Export für soziale Plattformen.
Ampere.SH
Kostenloses verwaltetes OpenClaw‑Hosting. KI‑Agenten in 60 Sekunden mit $500 Claude‑Guthaben bereitstellen.
Paper Banana
KI-gestütztes Tool, das akademischen Text sofort in veröffentlichungsreife methodische Diagramme und präzise statistische Plots umwandelt.
Hitem3D
Hitem3D wandelt ein einzelnes Bild mithilfe von KI in hochauflösende, produktionsbereite 3D-Modelle um.
HookTide
KI‑gestützte LinkedIn‑Wachstumsplattform, die deine Stimme lernt, um Inhalte zu erstellen, Interaktionen zu fördern und die Leistung zu analysieren.
Create WhatsApp Link
Kostenloser WhatsApp-Link- und QR‑Generator mit Analytics, gebrandeten Links, Routing und Multi‑Agent‑Chat‑Funktionen.
GenPPT.AI
KI‑gestützter PPT‑Ersteller, der in Minuten professionelle PowerPoint‑Präsentationen mit Sprecherhinweisen und Diagrammen erstellt, verschönert und exportiert.
Palix AI
All‑in‑one AI‑Plattform für Creator, um mit einheitlichen Credits Bilder, Videos und Musik zu erzeugen.
Gobii
Gobii ermöglicht Teams, rund um die Uhr autonome digitale Arbeitskräfte zu erstellen, um Webrecherche und Routineaufgaben zu automatisieren.
Seedance 20 Video
Seedance 2 ist ein multimodaler KI-Video-Generator, der konsistente Charaktere, mehrszenige Erzählungen und nativen Ton in 2K liefert.
Veemo - AI Video Generator
Veemo AI ist eine All‑in‑One‑Plattform, die schnell hochwertige Videos und Bilder aus Text oder Bildern generiert.
AI FIRST
Konversationeller KI‑Assistent, der Forschung, Browseraufgaben, Web‑Scraping und Dateiverwaltung mittels natürlicher Sprache automatisiert.
WhatsApp Warmup Tool
Ein KI-gestütztes WhatsApp-Warmup-Tool automatisiert Massenversand und verhindert Kontosperrungen.
GLM Image
GLM Image kombiniert hybride autoregressive und Diffusionsmodelle, um hochauflösende KI-Bilder mit außergewöhnlicher Textrendering-Qualität zu erzeugen.
Manga Translator AI
AI Manga Translator übersetzt Manga-Bilder sofort online in mehrere Sprachen.
TextToHuman
Kostenloser AI-Humanizer, der AI-Text sofort in natürliches, menschlich wirkendes Schreiben umschreibt. Keine Anmeldung erforderlich.
ainanobanana2
Nano Banana 2 erzeugt in 4–6 Sekunden Pro‑Qualität 4K‑Bilder mit präziser Textrendering und Konsistenz der Motive.
Remy - Newsletter Summarizer
Remy automatisiert das Newsletter-Management, indem E-Mails in leicht verständliche Erkenntnisse zusammengefasst werden.
Free AI Video Maker & Generator
Kostenloser KI-Videoersteller & Generator – Unbegrenzt, keine Anmeldung erforderlich

DeepMind-CEO stellt OpenAIs Strategie in Frage und plädiert für 'Weltmodelle'

Der CEO von Google DeepMind, Demis Hassabis, argumentiert, dass große Sprachmodelle wie ChatGPT für echte wissenschaftliche Durchbrüche nicht ausreichen und dass 'Weltmodelle' die Zukunft der KI sind.