AI News

Новая парадигма в фотонных вычислениях (Photonic Computing)

Коллаборативная исследовательская группа из Шанхайского университета Цзяотун и Университета Цинхуа представила «LightGen» — революционный полностью оптический вычислительный чип, который, согласно сообщениям, превосходит широко используемый графический процессор Nvidia A100 более чем в 100 раз в конкретных задачах генеративного ИИ (Generative AI). Результаты исследования, опубликованные в престижном журнале Science, знаменуют собой важную веху в стремлении преодолеть физические ограничения традиционных кремниевых полупроводников.

По мере того как модели искусственного интеллекта экспоненциально растут в размерах и сложности, энергопотребление и управление тепловыделением электронных чипов становятся критическими узкими местами. LightGen решает эти проблемы, заменяя электроны фотонами, используя внутреннюю скорость света и интерференционные свойства оптики для выполнения вычислений с беспрецедентной эффективностью. Этот прорыв предполагает, что фотонные вычисления (photonic computing), которые ранее ограничивались нишевыми приложениями и простыми задачами классификации, вскоре могут стать способными справляться с тяжелыми нагрузками, требуемыми современными рабочими процессами генеративного ИИ.

Архитектура LightGen

В основе производительности LightGen лежит его способность интегрировать более 2 миллионов искусственных фотонных нейронов на одном устройстве. Предыдущие попытки создания оптических вычислений часто ограничивались несколькими тысячами нейронов, что сужало их полезность до базового распознавания образов. Исследовательская группа под руководством профессора Чэнь Итуна из Шанхайского университета Цзяотун (Shanghai Jiao Tong University) использовала передовые методы 3D-упаковки и ультратонкие метаповерхности (metasurfaces) для достижения такого масштабного расширения.

Трехмерная фотонная интеграция

В отличие от традиционных плоских чипов, где компоненты расположены рядом друг с другом, LightGen использует трехмерную архитектуру. Такое стекирование позволяет резко увеличить плотность нейронов без соответствующего увеличения занимаемой площади чипа. Дизайн имитирует сложные связи биологических нейронных сетей более точно, чем стандартные 2D-электронные схемы, обеспечивая массовый параллелизм.

Оптическое латентное пространство (Optical Latent Space)

Одной из самых инновационных особенностей LightGen является использование «оптического латентного пространства (Optical Latent Space)». В типичных гибридных системах данные должны часто преобразовываться между оптическим и электронным доменами (О/Э-преобразование), что вносит задержку и потребляет значительную энергию. LightGen сводит к минимуму эти преобразования, сохраняя данные в оптическом домене на протяжении большей части конвейера обработки.

Используя метаповерхности — материалы, спроектированные так, чтобы обладать свойствами, не встречающимися в природе, — чип действует как оптический кодировщик. Он сжимает многомерные данные, такие как изображения в полном разрешении, в компактное оптическое представление. Затем эти данные проходят через массив оптических волокон, где фактические вычисления (инференс) происходят посредством интерференции света, эффективно выполняя умножение матриц со скоростью света при почти нулевом потреблении энергии на само вычисление.

Тесты производительности: LightGen против Nvidia A100

Показатели производительности, опубликованные исследовательской группой, подчеркивают резкий контраст между фотонными и электронными вычислительными парадигмами для конкретных рабочих нагрузок. В то время как Nvidia A100 остается универсальной мощной системой общего назначения, LightGen демонстрирует возможности узкоспециализированного оптического ускорения.

Таблица: Сравнительные показатели производительности

Показатель LightGen (Оптический) Nvidia A100 (Электронный)
Скорость вычислений (TOPS) 35 700 ~624 (Int8 Tensor)*
Энергоэффективность (Energy Efficiency) (TOPS/Вт) 664 ~1.5 - 2.0
Количество нейронов 2 млн+ Н/Д (на базе транзисторов)
Среда обработки Фотоны (Свет) Электроны
Основное применение Задачи генеративного зрения Обучение/инференс ИИ общего назначения

Примечание: производительность Nvidia A100 варьируется в зависимости от точности (FP16, FP32, Int8). Сравнение подчеркивает пиковую пропускную способность для задач инференса.

Заявленный показатель «в 100 раз быстрее» относится именно к высокопроизводительной генерации контента, такого как изображения и видеокадры. В лабораторных тестах LightGen достиг вычислительной скорости в 35 700 тераопераций в секунду (TOPS) — показатель, который затмевает теоретические максимумы современного кремниевого потребительского оборудования при поправке на энергопотребление. Что еще более впечатляюще, он достиг этой скорости с энергоэффективностью 664 TOPS на ватт, предлагая потенциальное решение проблемы огромного углеродного следа, связанного с крупномасштабным развертыванием ИИ.

Разблокировка генеративных возможностей

Исторически фотонные чипы с трудом обеспечивали точность, необходимую для генеративных задач. Хотя они отлично справлялись с идентификацией кошки на картинке (классификация), они не могли эффективно нарисовать кошку с нуля (генерация). LightGen преодолевает этот барьер.

Высококачественная генерация изображений и видео

Исследователи продемонстрировали способность LightGen выполнять сложные циклы «ввод-понимание-семантическая манипуляция-генерация» полностью оптически. В тестах, включающих перенос стиля, шумоподавление изображений и генерацию 3D-сцен, чип показал результаты, сопоставимые по качеству с ведущими электронными нейронными сетями.

Поскольку чип обрабатывает изображения в полном разрешении без необходимости разбивать их на более мелкие «патчи» (фрагменты) — распространенный метод в электронной обработке для экономии памяти — LightGen более эффективно сохраняет глобальную семантическую информацию. Это приводит к тому, что сгенерированные изображения не только создаются быстрее, но и сохраняют высокую структурную связность.

Неконтролируемое оптическое обучение

Еще одним значительным достижением, представленным в LightGen, является новый алгоритм неконтролируемого обучения (unsupervised training), адаптированный для фотонного оборудования. Традиционное глубокое обучение в значительной степени опирается на размеченные наборы данных и обратное распространение ошибки, которые вычислительно дорого реализовать в оптических системах. Подход LightGen основан на статистическом распознавании образов, что позволяет чипу изучать вероятностные представления данных. Это снижает зависимость от массивных размеченных наборов данных и лучше согласуется с физикой оптической интерференции.

Последствия для отрасли и перспективы на будущее

Появление LightGen происходит в критический момент для мировой полупроводниковой промышленности. Поскольку действие закона Мура (Moore's Law) замедляется, а физические пределы масштабирования транзисторов становятся все более очевидными, отрасль активно ищет альтернативы «пост-Муровской» эпохи.

Энергоэффективность в центрах обработки данных

Если эффективность, продемонстрированная LightGen, удастся масштабировать и коммерциализировать, это может радикально изменить экономику центров обработки данных ИИ. В настоящее время инфраструктура охлаждения, необходимая для кластеров графических процессоров, потребляет почти столько же энергии, сколько сами чипы. Оптический процессор, выделяющий минимальное количество тепла, мог бы устранить большую часть этих накладных расходов, позволяя создавать более плотные и экологичные серверные фермы.

Стратегическое значение для Китая

Для китайской полупроводниковой промышленности прорывы в области фотонных вычислений предлагают потенциальный путь в обход ограничений на передовое литографическое оборудование. В то время как производство ультрасовременных электронных чипов требует литографических машин экстремального ультрафиолета (EUV), доступ к которым в настоящее время ограничен, фотонные чипы, такие как LightGen, часто могут быть изготовлены с использованием более старых и доступных технологических узлов (таких как 65 нм или 45 нм) без ущерба для производительности. Это связано с тем, что длина волны света намного больше, чем нанометровые транзисторы в современных процессорах, что делает процесс изготовления менее зависимым от абсолютно минимальных размеров элементов.

Проблемы коммерциализации

Несмотря на впечатляющие характеристики, LightGen остается лабораторным прототипом, и существуют значительные препятствия, прежде чем он сможет бросить вызов доминированию Nvidia на коммерческом рынке.

  • Специализация против универсальности: Nvidia A100 и H100 — это программируемые устройства общего назначения, способные запускать все: от моделирования погоды до обучения больших языковых моделей (LLM). LightGen в настоящее время является специализированным ускорителем, оптимизированным для конкретных задач генерации визуального контента. Он пока не может просто «запускать код на Python».
  • Системная интеграция: Интеграция оптических чипов с существующей электронной инфраструктурой (ЦП, ОЗУ, хранилище) создает узкие места в передаче данных. Преимущество оптического чипа в скорости может быть потеряно, если он будет тратить слишком много времени на ожидание преобразования электронных данных в световые сигналы.
  • Сложность производства: Хотя требования к литографии могут быть ниже, массовое производство фотонных чипов с 3D-стекированием и миллионами прецизионных метаповерхностей создает свои собственные проблемы с выходом годной продукции и надежностью.

Заключение

LightGen представляет собой переломный момент в области оптических вычислений. Продемонстрировав, что фотонные чипы могут справляться со сложными генеративными нагрузками с эффективностью на несколько порядков выше, чем у кремния, исследователи из университетов Цзяотун и Цинхуа подтвердили технологический путь, который долгое время считался теоретическим. Хотя он может не заменить графический процессор завтра, LightGen освещает будущее, в котором свет, а не электричество, будет питать следующее поколение искусственного интеллекта.

Рекомендуемые