
作為邁向技術獨立的重要舉措,TikTok 和抖音的母公司字節跳動(ByteDance)據報導正與三星電子(Samsung Electronics)進行高級談判,以製造其專有的定製 AI 晶片。這一戰略轉向標誌著這家中國科技巨頭在基礎設施規劃中的關鍵演變,旨在全球供應鏈趨緊和地緣政治限制下,確保先進處理器的穩定供應。
根據最近的行業報告,字節跳動計劃生產多達 350,000 顆其專有的 AI 推理晶片(AI inference chips),工程樣品預計最早將於 2026 年 3 月交付。如果成功,這一合作夥伴關係可能會大幅減少字節跳動對輝達(Nvidia)等外部供應商的依賴,並重塑中國互聯網巨頭之間 AI 半導體採用的競爭格局。
此次合作重點在於生產專為 **AI 推理工作負載(AI inference workloads)**設計的晶片——即通過訓練好的 AI 模型運行即時數據以生成預測或建議的過程。雖然 字節跳動(ByteDance) 歷來在訓練和推理方面都依賴輝達(Nvidia)的 GPU,但其 TikTok 等平台推薦演算法的巨大規模,需要通用 GPU 處理效率較低的強大、專門的計算能力。
據報導,該協議概述了分階段的生產時間表:
至關重要的是,據報導談判範圍超出了邏輯晶片製造,還包括 高頻寬記憶體(High Bandwidth Memory,HBM) 的供應。隨著全球 AI 熱潮導致記憶體供應出現嚴重瓶頸,確保直接獲得三星的記憶體庫存可能是字節跳動選擇合作夥伴的決定性因素。三星作為領先的代工廠和頂級記憶體製造商,擁有獨特的地位,能提供其他代工廠難以匹敵的「統包(turnkey)」解決方案。
要理解這一發展的意義,必須區分 AI 工作負載的兩個核心階段:訓練和推理。
對於像 TikTok 這樣面向消費者的平台而言,由於每天有數十億活躍用戶需要瞬時推薦,推理成本往往使訓練成本顯得微不足道。通過設計僅針對其特定推薦架構優化的定製矽片,字節跳動在理論上可以實現比使用現成商用 GPU 更高的每瓦性能。
AI 工作負載需求比較
| 特性 | AI 訓練 | AI 推理 |
|---|---|---|
| 主要目標 | 構建模型智能 | 即時執行模型 |
| 計算強度 | 極高(批處理) | 中等(需要低延遲) |
| 硬體重點 | 原始 FLOPS、記憶體頻寬 | 效率、響應時間、成本 |
| 字節跳動背景 | 開發大語言模型(豆包) | 提供 TikTok/抖音動態內容 |
字節跳動對 定製晶片(custom silicon) 的推動不僅僅是技術上的優化;它是源於地緣政治摩擦的戰略必然。美國實施了一系列嚴格的出口管制,限制向中國實體銷售尖端 AI 加速器(如輝達的 H100 甚至降級版的 H20)。
雖然推理晶片通常比訓練晶片需要的處理能力更低——這可能允許它們在稍微舊一些、不受限制的製程節點(如 5nm 或 7nm)上製造——但供應鏈仍然脆弱。通過設計自己的晶片並與三星(一家韓國公司)合作,字節跳動正試圖分散其供應鏈風險。三星在遵守美國法規的同時,為台積電(TSMC)提供了一個重要的替代方案,而台積電目前由於 Apple、Nvidia 和 AMD 的需求正處於滿負荷運轉狀態。
字節跳動在此努力中並不孤單。軟體公司設計自己的硬體的「垂直整合」趨勢已成為全球科技巨頭的標準。亞馬遜(AWS Inferentia)、Google(TPU)和微軟(Maia)早已確立了這一路徑。在中國,制裁加劇了這種迫切性。
中國科技巨頭內部晶片開發狀況
| 公司 | 晶片項目重點 | 戰略目標 | 主要挑戰 |
|---|---|---|---|
| 字節跳動 | AI 推理晶片 | 優化推薦引擎(TikTok/抖音) | 缺乏硬體基因;三星良率 |
| 阿里巴巴 | 倚天(CPU)與含光(NPU) | 雲端基礎設施效率(阿里雲) | 獲得先進代工節點(TSMC/Arm) |
| 騰訊 | 紫霄(AI 推理) | 內部影片處理與 AI 服務 | 軟體棧整合 |
| 百度 | 昆侖(通用 AI) | 支持文心一言與自動駕駛 | 百度以外的生態系統採用 |
儘管目標樂觀,但通往定製晶片之路充滿挑戰。半導體設計以資本密集和不容出錯而聞名。架構上的缺陷或製造過程中的失敗(良率)都可能導致價值數百萬美元的延遲。此外,構建一個允許字節跳動開發者將代碼從輝達的 CUDA 平台無縫遷移到新定製晶片的軟體棧,將是一項艱鉅的工程任務。
當被要求對這些報告發表評論時,字節跳動表示有關其內部晶片項目的信息「不準確」,但未提供具體修正。三星電子(Samsung Electronics) 則拒絕置評。此類否認在半導體行業的活躍談判階段很常見,通常旨在保護商業機密或管理股市預期。
如果字節跳動成功部署 350,000 顆定製推理晶片,這將標誌著公司的轉折點,將其從單純的軟體演算法領導者轉變為垂直整合的 AI 強權。此舉不僅能使公司免受部分地緣政治衝擊,還能大幅降低運營全球最受歡迎影片應用的成本。隨著 2026 年 3 月的臨近,業界將密切關注首批矽片樣品是否能兌現其承諾。