AI News

Глобальная нехватка памяти угрожает задержать корпоративные проекты ИИ

Растущий спрос на искусственный интеллект сталкивается с хрупкой цепочкой поставок аппаратного обеспечения, создавая «идеальный шторм», который может сорвать дорожные карты корпоративного ИИ на ближайшие годы. По мере того как организации гонятся за созданием локальных возможностей для ИИ, они сталкиваются с острой глобальной нехваткой ключевых компонентов хранения — в частности DRAM и NAND Flash. При прогнозируемом росте цен более чем на 50% и сроках поставки критического оборудования, превышающих год, CIO и IT-руководители вынуждены пересматривать свои стратегии инфраструктуры.

Эта нехватка, вызванная беспрецедентным аппетитом гипермасштаберов и взрывным ростом генерации данных, знаменует собой фундаментальную переустановку равновесия спроса и предложения. Для аудитории Creati.ai понимание нюансов этого аппаратного кризиса критично, так как он напрямую влияет на осуществимость и сроки развёртывания генеративного ИИ (Generative AI) и больших языковых моделей (Large Language Models, LLMs) в корпоративных центрах обработки данных.

Анатомия скачка цен

Эпоха дешёвого и доступного хранилища, похоже, подходит к концу, сменяясь периодом чрезвычайной волатильности и удорожания. Аналитики отрасли и поставщики оборудования бьют тревогу по поводу повышения цен, которое носит не просто инфляционный, а структурный характер.

Согласно недавнему анализу рынка, ожидается значительный рост цен на DRAM и NAND в течение 2026 года. Brad Gastwirth, глобальный руководитель исследований в Circular Technology, описывает ситуацию как «фундаментальную переустановку». Говоря о текущей динамике рынка, он отметил, что память и хранилище перестали быть второстепенными компонентами и стали основными системными ограничителями производительности. Вывод ясен: оборудование, необходимое для запуска ИИ-нагрузок, становится узким местом.

Финансовое воздействие на предприятия ощутимо. Scott Tease, вице-президент по ИИ и высокопроизводительным вычислениям в Lenovo, дал трезвый прогноз, предполагая, что цены на некоторые компоненты могут увеличиться в четыре раза по сравнению с началом 2025 года. Он указал на траекторию 64-Gigabyte DIMM — стандартного блока памяти для серверов, ноутбуков и рабочих станций. Ранее такой модуль закупали в ценовом диапазоне около $200, тогда как цена на идентичный компонент в ближайшие месяцы прогнозируется около $800.

Такой драматический рост цен неизбежно влияет на всю экосистему оборудования. Независимо от того, закупает ли предприятие новые готовые к ИИ серверы или модернизирует существующую инфраструктуру центров обработки данных, смета материалов готова взорваться. TrendForce, ведущий поставщик рыночной аналитики, подтверждает эти опасения, прогнозируя, что цены на DRAM вырастут на 55–60% в первом квартале 2026 года по сравнению с предыдущим годом, а цены на NAND Flash пойдут по аналогичной восходящей траектории в 33–38%.

«Распроданный» дата-центр

Помимо цены, сама недоступность оборудования представляет более экзистенциальную угрозу срокам проектов. Цепочка поставок в настоящее время значительно смещена в пользу крупнейших игроков — гипермасштаберов (таких как AWS, Google и Microsoft) и крупных OEM — которые заключили долгосрочные контракты на поставки, некоторые из которых действуют до 2027 года.

Этот эффект «выдавливания» оставляет предприятия среднего и малого размера в борьбе за остатки на спотовом рынке. Главный директор по продукту Western Digital, Ahmed Shihab, подтвердил общую напряжённость отрасли, отметив, что предложение останется ограниченным и в следующем году. Двигателем, как ни странно, является ИИ. Как для обучения массивных базовых моделей, так и для выполнения инференса в масштабах, ИИ-нагрузки требуют огромных объёмов высокоскоростного хранения. Средняя ёмкость поставляемых дисков растёт, но общее количество доступных единиц по-прежнему недостаточно, чтобы удовлетворить аппетит рынка.

Производители неохотно расширяют производственные мощности, получив шрамы от предыдущих циклов бума и спада, когда они вкладывали миллиарды в заводы, а к моменту выхода мощностей на мощность рынок оказывался переполнен. Строительство полупроводникового завода — капиталоёмкое предприятие, стоимость которого превышает $50 млрд и занимает более 15 месяцев. В результате поставщики отдают приоритет высокомаржинному спросу на серверы для ИИ, перенаправляя производственные линии от традиционных продуктов памяти. Этот сдвиг создаёт дефицит в других областях, таких как MLC (Multi-Level Cell) NAND Flash, широко используемый в промышленном и сетевом оборудовании. Ожидается, что Samsung прекратит производство MLC NAND в середине 2026 года, и ёмкость для этой конкретной технологии, по прогнозам, упадёт на 42% уже в этом году.

Технологические сдвиги: рост QLC

Пока отрасль борется с нехваткой традиционного высокопроизводительного хранилища, происходит технологический сдвиг, направленный на смягчение кризиса ёмкости. Набирает обороты применение твердотельных накопителей с Quad-Level Cell (QLC). Технология QLC обеспечивает большую плотность хранения, сохраняя по четыре бита данных в ячейке по сравнению с тремя в TLC (Triple-Level Cell) или двумя в MLC.

TrendForce прогнозирует, что скоро накопители QLC будут составлять около 30% рынка корпоративных SSD. Этот сдвиг вызван необходимостью: QLC позволяет получить большие ёмкости в меньшем физическом объёме, что критично для дата-центров, испытывающих дефицит пространства в стойках и электроэнергии. Однако QLC имеет компромиссы, прежде всего по показателям износостойкости и скоростям записи по сравнению с предшественниками.

Для проектировщиков корпоративной ИТ-архитектуры этот переход требует изменения стратегии управления данными. Tom Coughlin, член IEEE и президент Coughlin Associates, предлагает организациям адаптироваться к характеристикам QLC. Консолидируя данные и минимизируя количество операций записи, предприятия могут продлить срок службы QLC-компонентов. Это согласуется с более широкой тенденцией оптимизации уровней хранения — держать «горячие» данные на дефицитных, высокопроизводительных NVMe-дисках, а «тёплые» или «холодные» данные переносить на высокоплотные QLC-уровни.

Стратегические ответы для CIO

Столкнувшись с взлётом затрат и сроками поставки, которые могут превышать год для SSD большой ёмкости, CIO должны принять оборонительные стратегии, чтобы сохранить свои инициативы по ИИ. Подход «покупайте всё, что может понадобиться» больше не жизнеспособен для большинства организаций из‑за непомерной стоимости.

Сравнение прогноза рынка

Ниже приведена таблица, отражающая резкий сдвиг в ландшафте хранения, с которым должны справиться корпоративные лидеры:

Metric Pre-Shortage Era (2024-Early 2025) Current Crisis & Future Outlook (2026+)
Price Trend Стабильно / Снижение за ГБ Резкий рост (>50% до 400%)
Lead Time Недели Месяцы до >1 года для SSD большой ёмкости
Technology Focus TLC / MLC NAND QLC NAND / HBM (High Bandwidth Memory)
Supply Access Открытый спотовый рынок Ограничен (гипермасштаберы заблокировали контракты до 2027)
Primary Constraint Бюджет Доступность компонентов и производственные мощности

Эксперты рекомендуют несколько прагматичных шагов для навигации в этом кризисе:

  • Отложить не критичные обновления: аналитик Forrester Brent Ellis советует предприятиям среднего размера приостановиться. Если организация планирует маленький кластер для ИИ, возможно, целесообразно отложить покупку оборудования на несколько месяцев, если это возможно, вместо покупки на пике ценового пузыря.
  • Оптимизировать существующие активы: прежде чем закупать новое оборудование, проведите жесткий аудит текущих хранилищ. Дедупликация, компрессия и архивирование неиспользуемых данных могут освободить петабайты пространства без единого потраченного доллара на новое оборудование.
  • Гибридные облачные стратегии: хотя цены на облачное хранилище также, вероятно, вырастут по мере того, как гипермасштаберы переложат издержки, облако может предложить больше гибкости по сравнению с локальным оборудованием для краткосрочных всплесков активности ИИ. Однако это нужно балансировать с долгосрочными затратами на вывод данных.
  • Оптимизация программного обеспечения: инвестиции в эффективность кода могут снизить аппаратный след, необходимый для моделей ИИ. Техники вроде квантизации и праунинга моделей могут уменьшить требования к памяти LLM, позволяя запускать их на доступном, более низком уровне оборудования.

Самоисполняющееся пророчество Data Science

Нехватка усугубляется самой природой дата-сайенса: чем больше доступно хранилища, тем больше оно потребляется. Falko Kuester, профессор инженерии в UC San Diego, подчеркнул этот феномен на примере проекта Open Heritage 3D. По мере того как они собирают высокоточные сканы исторических объектов — LIDAR, облака точек и изображения высокого разрешения — объём их данных экспоненциально растёт. Они ожидают достичь петабайта данных в течение 18 месяцев.

Этот сценарий повторяется в каждом предприятии, инвестирующем в ИИ. Создаются наборы «ground truth» данных, затем копии для обучения, валидации и тестирования. Затем их аннотируют и дополняют, умножая требование к хранилищу на каждом шагу. По мере повышения разрешения и усложнения моделей «природа зверя» — потреблять каждый доступный байт хранилища.

Заключение

Глобальная нехватка хранилища — это не временное явление, а значительное структурное препятствие для индустрии ИИ. По мере развития 2026 года способность обеспечить оборудование станет ключевым конкурентным преимуществом. Предприятия, которые не планируют с учётом увеличенных сроков поставки и раздутых бюджетов, рискуют обнаружить, что их проекты ИИ застряли не из‑за отсутствия алгоритмов или талантов, а из‑за простой невозможности хранить данные, которые их подпитывают. Для сообщества Creati.ai послание ясно: физический уровень инфраструктуры ИИ требует немедленного и стратегического внимания.

Рекомендуемые