Генеральный директор DeepMind оспаривает стратегию OpenAI, выступая за «модели мира»

Генеральный директор DeepMind ставит под сомнение стратегию OpenAI, выступая за «модели мира» (World Models)

В определяющий момент для индустрии искусственного интеллекта (Artificial Intelligence) генеральный директор Google DeepMind Демис Хассабис публично поставил под сомнение преобладающее доминирование больших языковых моделей (Large Language Models, LLMs), утверждая, что текущий путь, предпочитаемый такими конкурентами, как OpenAI, недостаточен для достижения истинного искусственного общего интеллекта (Artificial General Intelligence, AGI). В эфире подкаста CNBC «The Tech Download» 19 января 2026 года Хассабис изложил стратегический поворот в сторону «моделей мира» — систем, способных моделировать физическую реальность и понимать причинно-следственные связи, а не просто предсказывать текст на основе статистических корреляций.

Эта критика знаменует существенное расхождение в философских и технических дорожных картах ведущих мировых лабораторий ИИ. В то время как OpenAI под руководством Сэма Олтмана исторически делала ставку на законы масштабирования — идею о том, что увеличение вычислений и объёма данных неизбежно ведёт к росту интеллекта — Хассабис предполагает, что этот подход натолкнулся на «фундаментальную стену» в контексте научных открытий и рассуждений от первых принципов.

Ограничение масштабирования, основанного на тексте

Суть аргумента Хассабиса заключается в различии между обработкой информации и физическим пониманием. Большие языковые модели отлично справляются с разбором огромных объёмов текста, созданного людьми, чтобы находить шаблоны. Однако Хассабис утверждает, что эти модели «на самом деле не понимают причинности». Они могут описать падающее яблоко на основе описаний в данных обучения, но не способны смоделировать физику гравитации в новой среде, чтобы предсказать результат, которого они ранее не видели.

«Современные большие языковые модели феноменальны в распознавании шаблонов, — заявил Хассабис в интервью. — Но они не знают, почему A ведёт к B. Они просто предсказывают следующий токен.»

Для читателей Creati.ai это различие критично. Оно подразумевает, что в то время как большие языковые модели продолжат совершенствоваться как интерфейсы для общения и помощники по программированию, они могут остаться неспособными к тем прорывам уровня AlphaGo, которые требуются для решения сложных научных задач, таких как открытие новых материалов или лечение болезней. Хассабис оценивает, что до AGI остаётся ещё 5–10 лет, и для его достижения потребуются архитектуры, выходящие за рамки текущей парадигмы на базе Transformer.

Определение «модели мира»

Альтернативное видение DeepMind сосредоточено на создании ИИ, который строит внутреннее представление физического мира. Эти «модели мира» функционируют скорее как игровой движок, чем как библиотека. Они могут проводить «мысленные эксперименты», симулировать результаты в 3D-пространстве и проверять гипотезы в соответствии с согласованным набором физических законов.

DeepMind уже начал демонстрировать жизнеспособность этого подхода. Хассабис указал на Genie 3, систему, выпущенную в августе 2025 года, которая генерирует интерактивные 3D-среды из текстовых подсказок, и SIMA 2, которая обучает AI-агентов ориентироваться и выполнять задачи в этих смоделированных мирах. Ранние исследования показывают, что эти гибридные системы — сочетающие понимание языка с пространственным мышлением — превосходят чисто языковые модели на 20–30 % в задачах сложного рассуждения и значительно снижают количество галлюцинаций, связанных с базовой физикой.

Стратегическое расхождение: Google против OpenAI

Время этих заявлений не случайно. Индустрия ИИ сейчас переживает период интенсивной нестабильности. После запуска Gemini 3 в конце 2025 года появились сообщения о внутреннем «Code Red» в OpenAI, вызванном опасениями, что их стратегия масштабирования приносит всё меньшую отдачу. Публично обозначая ограничения пути, основанного только на больших языковых моделях, Хассабис позиционирует Google не просто как конкурента, а как пионера следующего архитектурного скачка в ИИ.

Этот сдвиг носит как оперативный, так и философский характер. Хассабис рассказал, что теперь он находится в ежедневном контакте с генеральным директором Alphabet Сундаром Пичаи — изменение, подчёркивающее повышенный статус DeepMind как единственной «двигательной силы» AI-усилий Google. Такая упрощённая структура призвана ускорить трансляцию исследовательских прорывов в потребительские продукты и является прямым ответом на критику в адрес Google о медленных темпах преобразований.

Геополитический контекст: Китай сокращает отставание

Помимо технической дискуссии, Хассабис дал трезвую оценку глобального ландшафта ИИ. На вопрос о международной конкуренции он отметил, что китайские модели ИИ быстро сокращают разрыв по производительности с западными аналогами.

«Это вопрос месяцев, а не лет», — сказал Хассабис о разрыве между передовыми моделями США и Китая. Он сослался на быстрые достижения таких компаний, как Alibaba, и стартапов, например Moonshot AI. Однако он обозначил тонкое различие: пока китайские лаборатории сильны в быстром воспроизведении и инженерном мастерстве, Хассабис сомневается, способствует ли текущая экосистема в Китае формированию специфического «мышления», необходимого для нуля-в-единицу научных прорывов, таких как первоначальное изобретение архитектуры Transformer исследователями Google.

Сравнительный анализ: большие языковые модели против моделей мира

Чтобы понять ставки в этом архитектурном споре, полезно сопоставить возможности и ограничения двух доминирующих подходов, которые сейчас претендуют на ресурсы.

Сравнение больших языковых моделей и моделей мира

Feature	Large Language Models (LLMs)	World Models
Core Mechanism	Statistical pattern recognition and token prediction	Simulation of physical reality and causality
Primary Data Source	Text, code, and static images from the internet	3D environments, physics engines, and video data
Reasoning Capability	Correlative (associative logic)	Causal (first-principles reasoning)
Key Limitation	Hallucinations and lack of spatial awareness	High computational cost for real-time simulation
Ideal Use Case	Creative writing, coding, summarization	Robotics, scientific discovery, autonomous agents
Example Systems	GPT-4, Claude 3, Llama 3	Genie 3, SIMA 2, AlphaFold

Последствия для индустрии ИИ

Поддержка Хассабисом моделей мира сигнализирует о более широкой тенденции в индустрии в сторону «нейросимволических» (neuro-symbolic) или гибридных систем ИИ. Для разработчиков и руководителей предприятий это означает, что эпоха, когда полагались исключительно на промпт-инжиниринг для текстовых моделей, может переходить в фазу, где пространственные вычисления и симуляция станут критическими компонентами AI-стека.

Если гипотеза DeepMind подтвердится, следующее поколение ИИ будет не просто обсуждать мир — оно сможет в нём ориентироваться. Эта способность необходима для открытия потенциала физической экономики, включая передовую робототехнику и автономные научные эксперименты. В то время как OpenAI продолжает совершенствовать «мозг» ИИ через язык, DeepMind, по-видимому, сосредоточен на том, чтобы дать этому мозгу тело и мир, в котором он сможет жить.

По мере развития 2026 года индустрия, вероятно, увидит разделение в развитии моделей: один путь будет оптимизироваться для языковой беглости, другой — для физического интеллекта. Для Creati.ai мы будем пристально следить за тем, как эти модели мира интегрируются с существующими генеративными инструментами, возможно создавая новый класс приложений, объединяющих творческую генерацию и научную точность.