AI News

全球儲存短缺恐延宕企業AI專案進度

對人工智慧需求的急速飆升正與脆弱的硬體供應鏈相撞,形成一場可能擾亂未來數年企業AI時程的「完美風暴」。當組織爭相建置內部(on-premise)AI能量時,正面臨關鍵儲存元件的全球嚴重短缺——具體而言為 DRAM 與 NAND Flash。隨著價格預計飆升超過50%且關鍵硬體的交期延長到超過一年,CIO 與 IT 領導人被迫重新思考其基礎架構策略。

此一短缺由超大規模雲端業者(hyperscalers)前所未有的需求與資料產量爆炸所驅動,標誌著供需平衡的根本重置。對 Creati.ai 讀者而言,理解這場硬體危機的細微差異至關重要,因為它會直接影響在企業資料中心中部署生成式AI(Generative AI)與大型語言模型(Large Language Models,LLMs)的可行性與時程。

價格飆升的結構

廉價且大量可得的儲存時代似乎將告一段落,取而代之的是極端波動與成本上升的時期。產業分析師與硬體供應商對於這波價格上漲發出警告,並非單純通膨,而是結構性的變動。

根據近期市場分析,DRAM 與 NAND 儲存的價格預計在整個 2026 年顯著上升。Circular Technology 全球研究主管 Brad Gastwirth 將此情勢形容為「根本重置」。談及當前市場動態時,他指出記憶體與儲存已從次要元件升格為主要的系統級效能瓶頸。含義明確:執行 AI 工作負載所需的硬體正成為瓶頸。

這對企業的財務影響相當明顯。聯想(Lenovo)AI 與高效能運算(HPC)副總裁 Scott Tease 提出嚴峻預測,建議某些元件的價格相較於 2025 年初可能成長至四倍。他特別指出 64-Gigabyte DIMM 的價格走勢——這是伺服器、筆電與工作站常見的記憶體建置單位。該相同元件過去採購價約在低 200 美元區間,但預計在未來數月將逼近 800 美元。

如此劇烈的價格上升不可避免地影響整個硬體生態系。不論企業是採購新的 AI-ready 伺服器或升級既有的 資料中心 基礎建設,材料清單的開銷都將暴增。市場情報供應商 TrendForce 也證實這些擔憂,預測 DRAM 價格在 2026 年第一季將較去年大幅跳升 55% 至 60%,而 NAND Flash 價格亦預計呈現類似的上漲趨勢,約 33% 至 38%。

「售罄」的資料中心

除了價格,硬體的實際不可得性對專案時程構成更存在性的威脅。供應鏈 目前明顯偏向最大玩家——超大規模雲端業者(例如 AWS、Google 與 Microsoft)與主要 OEM——這些玩家已簽訂長期供應合約,有些合約甚至延伸至 2027 年。

這種「排他化」效應使中型企業與較小的業者只能在現貨市場搶奪殘餘供應。Western Digital 的產品長 Ahmed Shihab 確認整體產業供應吃緊,並指出供應將持續在明年維持緊繃。驅動因素不出所料是 AI。無論是訓練龐大的基礎模型,或是在大規模下執行推論,AI 工作負載都需要大量高速儲存。出貨硬碟的平均容量雖在增加,但可用單位總數仍不足以滿足市場的飢渴。

製造商對於擴充產能抱持謹慎態度,因過往經歷過榮景-蕭條週期,曾在興建晶圓廠上投資數十億,卻在設施上線時面臨市場供過於求。興建半導體廠為資本密集的工作,成本高達 500 億美元以上,且超過 15 個月的建置期。結果,供應商優先滿足高利潤的 AI 伺服器需求,並將生產線從傳統記憶體產品重新調配。此一轉向造成其他領域(例如廣泛運用於工業與網路設備的 MLC(Multi-Level Cell)NAND Flash)出現短缺。由於三星(Samsung)預期在 2026 年中停止 MLC NAND 生產,單就今年而言此特定技術的產能預計將下滑 42%。

技術轉向:QLC 的崛起

隨著業界應對傳統高效能儲存短缺,為緩解容量緊縮出現一波技術轉向。Quad-Level Cell(QLC)固態硬碟的採用正在加速。QLC 技術透過每個儲存單元儲存四位元資料來提高儲存密度,相較於 TLC(Triple-Level Cell)的三位元或 MLC 的兩位元。

TrendForce 預測 QLC 硬碟將很快佔據企業 SSD 市場的 30%。此轉向由必要性推動;QLC 允許在更小的物理體積內達到更高容量,對於機架空間與電力緊張的資料中心至關重要。然而,QLC 有其取捨,主要在耐久度與寫入速度上不如前代技術。

對企業 IT 架構師而言,這次轉換需要改變資料管理策略。IEEE 會士、Coughlin Associates 總裁 Tom Coughlin 建議組織必須適應 QLC 的特性。透過整合資料與最小化寫入次數,企業可以延長 QLC 元件的使用壽命。這也與優化儲存分層的更廣泛趨勢一致——將「熱」資料保留在稀缺且高效能的 NVMe 磁碟上,同時把「溫」或「冷」資料移至高密度的 QLC 階層。

CIO 的策略性回應

面對高容量 SSD 可能超過一年交期與飆升的成本,CIO 必須採取防禦性策略以維持其 AI 計畫。對多數組織而言,「買下你可能需要的一切」的做法已不再可行,因為成本過於高昂。

市場展望比較

下表說明企業領導人必須因應的儲存版圖劇變:

Metric Pre-Shortage Era (2024-Early 2025) Current Crisis & Future Outlook (2026+)
Price Trend Stable / Declining per GB Skyrocketing (>50% to 400% increase)
Lead Time Weeks Months to >1 Year for High-Cap SSDs
Technology Focus TLC / MLC NAND QLC NAND / HBM (High Bandwidth Memory)
Supply Access Open Spot Market Restricted (Hyperscalers locked contracts to 2027)
Primary Constraint Budget Component Availability & Production Capacity

專家建議數項務實步驟來應對這波緊縮:

  • 延後非關鍵升級: Forrester 分析師 Brent Ellis 建議中型企業暫緩。若組織規劃的是小型 AI 叢集,若可能的話,比起在價格高峰時購買,將硬體採購延後幾個月可能更為明智。
  • 優化現有資產: 在採購新硬體前,進行現有儲存的嚴格稽核。資料重複刪除、壓縮與封存未使用資料,能在不花一毛錢購買新硬體的情況下釋出 PB 級空間。
  • 混合雲策略: 雖然雲端儲存價格也可能因超大規模雲端業者轉嫁成本而上漲,但在短期的 AI 高峰期間,雲端可能比本地硬體提供更多彈性。但這必須權衡長期的資料流出成本(data egress)。
  • 軟體優化: 投資於程式效率可以降低執行 AI 模型所需的硬體規模。像是模型量化與剪枝等技術能減少大型語言模型的記憶體需求,使其能在現有、較低階的硬體上運行。

資料科學的自我實現式預言

短缺問題因資料科學本身的本質而被放大:可用儲存愈多,消耗愈快。加州大學聖地牙哥分校工程學教授 Falko Kuester 以 Open Heritage 3D 專案說明此現象。當他們收集古蹟的高解析掃描資料——LIDAR、點雲(point clouds)與高解析度影像——其資料足跡呈指數成長。他們預期在 18 個月內達到 PB 級資料。

每個投入 AI 的企業都在上演類似情境。「實地真值」(ground truth)資料集被建立後,會為訓練、驗證與測試而複製,再加上標註與擴增,使得每一步驟的儲存需求倍增。隨著解析度提高與模型變得更複雜,「本性」就是消耗每一個可用位元(byte)的儲存。

結論

全球儲存短缺並非短暫的閃失,而是對 AI 產業的重要結構性障礙。隨著 2026 年推進,取得硬體的能力將成為關鍵的競爭差異化因素。未為延長交期與膨脹預算做規劃的企業,風險在於其 AI 專案可能不是因為缺乏演算法或人才而停擺,而是單純因無法儲存驅動這些專案的資料。對 Creati.ai 社群而言,訊息明確:實體層的 AI 基礎設施 需要立即且具策略性的關注。

精選