AI News

Историческое соглашение по инфраструктуре ИИ

В переломный момент для будущего искусственного интеллекта компании Meta Platforms и NVIDIA укрепили свое многолетнее сотрудничество масштабным многолетним партнерским соглашением, направленным на развертывание миллионов ускорителей ИИ следующего поколения. Объявленная совместно генеральным директором Meta Марком Цукербергом (Mark Zuckerberg) и генеральным директором NVIDIA Дженсеном Хуангом (Jensen Huang) во вторник, эта сделка закрепляет за Meta статус одного из крупнейших в мире потребителей ускоренных вычислений, подкрепляя ее агрессивную дорожную карту по созданию общего искусственного интеллекта (Artificial General Intelligence, AGI).

Соглашение описывает комплексную стратегию цепочки поставок, которая выходит за рамки текущего внедрения архитектуры NVIDIA Blackwell. Что особенно важно, оно предоставляет Meta приоритетный доступ к предстоящей платформе графических процессоров (GPU) Rubin, широкомасштабное развертывание которой запланировано на конец 2026 года. Ожидается, что это расширение инфраструктуры обеспечит работу суперкластера «Prometheus» компании Meta и ускорит обучение будущих итераций семейства моделей Llama, потенциально достигая количества параметров, которое ранее считалось недостижимым.

«Мы создаем самую передовую инфраструктуру ИИ в мире», — заявил Цукерберг во время анонса. «Это партнерство гарантирует, что Meta останется на передовой ИИ с открытым исходным кодом, предоставляя нашим исследователям и мировому сообществу разработчиков вычислительные мощности, необходимые для решения самых сложных задач в области логического вывода и машинного познания».

Аппаратная основа: Blackwell и Rubin

Центральным элементом этого партнерства является интеграция последних инноваций NVIDIA в области полупроводников в гипермасштабируемые центры обработки данных Meta. В то время как Meta продолжает развертывать сотни тысяч графических процессоров H100 и Blackwell (B200), новое соглашение делает серьезный акцент на переходе к архитектуре Rubin.

Наступление эры Rubin

Платформа NVIDIA Rubin представляет собой смену поколений в плотности вычислений и энергоэффективности — факторах, имеющих решающее значение для плана капитальных вложений Meta в размере 135 миллиардов долларов на 2026 год. Архитектура Rubin включает в себя новый процессор «Vera» CPU — процессор на базе Arm, использующий кастомные ядра Olympus, в паре с графическим процессором Rubin GPU.

Для Meta переход на Rubin является стратегическим. Платформа использует память с высокой пропускной способностью 4 (High Bandwidth Memory 4, HBM4), что значительно облегчает проблемы с пропускной способностью памяти, которые часто ограничивают обучение моделей с триллионами параметров. Включение процессора Vera CPU обеспечивает более тесную связь рабочих нагрузок обработки, снижая задержку в массивных конвейерах приема данных, необходимых для обучения моделей на мультимодальных наборах данных, включая видео, текст и сенсорную информацию.

Сравнительный анализ: архитектура NVIDIA Blackwell против Rubin

В следующей таблице представлены этапы технической эволюции от текущих развертываний Blackwell до будущей инфраструктуры Rubin, указанной в соглашении.

Характеристика Платформа NVIDIA Blackwell Платформа NVIDIA Rubin
Техпроцесс архитектуры 4NP (кастомный 4-нм) 3-нм (TSMC N3)
Технология памяти GPU HBM3e HBM4
Связка с CPU Grace CPU (Arm Neoverse) Vera CPU (кастомные ядра Olympus)
Скорость интерконнекта NVLink 5 (1,8 ТБ/с) NVLink 6 (3,6 ТБ/с)
Сетевая интеграция InfiniBand / Ethernet Оптимизировано для Spectrum-X Ethernet

Spectrum-X и революция в сетевых подключениях

В то время как чистая вычислительная мощность попадает в заголовки газет, партнерство уделяет не меньшее внимание сетевой инфраструктуре. Meta обязалась провести крупномасштабное развертывание сетевой платформы NVIDIA Spectrum-X Ethernet. По мере того как кластеры ИИ разрастаются до сотен тысяч графических процессоров, трафик «восток-запад» — данные, перемещающиеся между серверами во время обучения — становится основным узким местом производительности.

Spectrum-X разработан специально для этих рабочих нагрузок ИИ. В отличие от традиционного Ethernet, который может страдать от потери пакетов и скачков задержки при высокой нагрузке, Spectrum-X использует механизмы адаптивной маршрутизации и контроля перегрузок, производные от технологии InfiniBand, но адаптированные для стандартных сред Ethernet.

Для Meta это прагматичный выбор. Стандартизируя использование Spectrum-X, Meta может использовать повсеместность и экономическую эффективность кабелей и коммутаторов Ethernet, достигая при этом производительности с низкой задержкой, необходимой для синхронного обучения массивных моделей. Эта сетевая фабрика станет нервной системой для новых центров обработки данных Meta в Индиане и других стратегических локациях, гарантируя, что миллионы чипов будут функционировать как единый сплоченный суперкомпьютер.

Стимулирование мечты об AGI с открытым исходным кодом

Масштаб этих инвестиций в инфраструктуру напрямую коррелирует с философской позицией Meta в отношении разработки ИИ. В отличие от конкурентов, таких как OpenAI и Google, которые в основном сохраняют свои передовые модели проприетарными, Meta продвигает стратегию открытых весов со своей серией Llama.

С появлением Llama 4 и последующих моделей поколения «Avocado» вычислительные требования возрастают по экспоненте. Чтобы поддерживать современный уровень производительности и при этом делать модели достаточно эффективными для широкого внедрения, Meta занимается «переобучением» (over-training) — обучением моделей на гораздо большем количестве токенов, чем стандартно для их размера. Этот подход позволяет создавать высокоэффективные модели меньшего размера, но требует значительно больше вычислительных ресурсов на этапе обучения.

Дженсен Хуанг (Jensen Huang) подчеркнул эту синергию, отметив: «Подход Meta с открытым исходным кодом является турбонаддувом для всей экосистемы ИИ. Размещая миллионы графических процессоров Rubin и Blackwell в своей инфраструктуре, они не просто создают продукт; они создают платформу, которой может воспользоваться каждый исследователь и стартап».

Финансовые и экологические риски

Финансовый масштаб этой сделки ошеломляет, отражая динамику «гонки вооружений», охватившую в настоящее время технологический сектор. Аналитики оценивают стоимость закупок оборудования в десятки миллиардов, что вносит значительный вклад в выручку NVIDIA от сегмента центров обработки данных. Для Meta это ставка с высокими ставками на то, что превосходная инфраструктура позволит создавать превосходные модели, которые, в свою очередь, будут способствовать вовлечению пользователей и доходам от рекламы в Facebook, Instagram и WhatsApp.

Однако развертывание сопряжено с трудностями, особенно в отношении энергопотребления. Ожидается, что плотность мощности стоек, заполненных «суперчипами» Rubin, выйдет за пределы возможностей современных технологий воздушного охлаждения. Вследствие этого Meta ускоряет инвестиции в системы жидкостного охлаждения и возобновляемые источники энергии для поддержки этих объектов гигаваттного масштаба. Кампус в Индиане, который должен стать одним из самых энергоемких центров обработки данных в мире, будет служить пилотной площадкой для этой новой эталонной архитектуры, сочетающей полупроводники NVIDIA с собственными разработками серверов Meta «Grand Teton».

По мере продвижения в 2026 год отрасль будет внимательно следить за тем, сможет ли это масштабное вливание полупроводников трансформироваться в прорывные возможности, обещанные стремлением к общему искусственному интеллекту (Artificial General Intelligence, AGI).

Рекомендуемые