AI News

OpenAI 指控 DeepSeek 通過模型蒸餾「搭便車」利用美國 AI 創新成果

加州舊金山 — 在美中技術競爭顯著升級的背景下,OpenAI 已正式向美國國會議員發出警告,指稱中國 AI 初創公司 DeepSeek 正系統性地利用「蒸餾(Distillation)」技術來複製美國專有人工智能模型的性能。

根據一份發送給眾議院美國與中國共產黨戰略競爭特設委員會(House Select Committee on the Strategic Competition Between the United States and the Chinese Communist Party)的備忘錄,以及彭博社與路透社於 2026 年 2 月 12 日的後續報導,OpenAI 指控 DeepSeek 正在採用「複雜」且「隱蔽」的方法從 OpenAI 的服務器提取數據。據稱,這些數據隨後被用於訓練 DeepSeek 自己的模型,包括最近廣受關注的 DeepSeek-R1,這實際上讓這家中國公司得以規避美國實驗室所承擔的巨大研發成本。

這一發展標誌著全球 AI 領域的一個關鍵時刻,將焦點從硬體出口管制轉向了無形但極具價值的模型權重與算法邏輯流向。

「模型蒸餾」的運作機制

這場爭議的核心是一種在機器學習中被稱為「知識蒸餾(Knowledge Distillation)」的技術。雖然這個術語聽起來很抽象,但該過程對領先 AI 實驗室的競爭護城河構成了實質性威脅。

在標準訓練場景中,AI 模型從原始數據集(數萬億個文本、代碼和圖像標記)中學習。這個過程需要巨大的算力和數月的處理時間。然而,模型蒸餾(Model Distillation)縮短了這一過程。一個「導師」模型(在此案例中,推測為 OpenAI 的 GPT-4 或 o1 系列)被廣泛查詢。而「學生」模型(DeepSeek 的架構)不僅學習正確答案,還學習導師模型提供的概率分佈和推理軌跡。

OpenAI 的備忘錄指出,DeepSeek 不僅僅是在使用公開輸出,而是正在積極規避安全防護措施,以大規模獲取這些高質量的訓練信號。通過這種方式,DeepSeek 據稱能以其美國競爭對手所需算力資源和資金投入的一小部分,實現近乎同等的性能。

AI 訓練方法的比較

為了理解 OpenAI 所引用的經濟與技術差距,有必要比較模型開發的兩種主要方法。

表 1:原生訓練 vs 模型蒸餾

特徵 原生基礎訓練 模型蒸餾(指控內容)
主要輸入 原始數據集(網頁、書籍、代碼) 來自卓越「導師」模型的輸出
計算成本 極高(數千個 GPU) 低至中(側重於優化)
開發時間 數月至數年 數週至數月
經濟負擔 數十億美元的研發與硬體投入 極低(僅為原始成本的一小部分)
產出模型 原創推理能力 具備潛在差距的模仿能力

「隱蔽」提取的證據

這些指控超出了簡單的使用違規。OpenAI 聲稱已檢測到與 DeepSeek 員工相關的特定對抗性行為模式。備忘錄概述了這些行為者如何利用偽裝的第三方網絡來掩飾查詢來源,從而規避 OpenAI 的地理位置和基於流量的封鎖。

備忘錄指出:「我們觀察到與 DeepSeek 員工關聯的賬號使用各種手段來規避訪問限制。」OpenAI 將這種活動定性為企圖在美國實驗室的技術突破上「搭便車」。這意味著 DeepSeek 常被譽為工程奇蹟的高效率,可能部分歸功於這種未經授權的智能轉移,而非單純的架構創新。

國家安全與安全護欄

除了商業影響,OpenAI 還針對 國家安全(National Security) 提出了警告。該公司警告立法者,當功能通過蒸餾被複製時,內建於原始模型中的安全對齊和倫理護欄往往會丟失或被捨棄。

DeepSeek 的模型以遵守嚴格的中國互聯網法規而聞名,會審查諸如台灣地位或 1989 年天安門廣場抗議活動等話題。然而,OpenAI 認為危險在於那些未被過濾的內容:即生成網絡攻擊手段或設計生物製劑的原始能力。

OpenAI 指出:「當功能通過蒸餾被複製時,安全防護措施往往會被拋諸腦後。」這創造了一種情境:蒸餾後的模型具備了美國前沿模型的危險能力,但缺乏旨在防止在生物或化學等高風險領域被濫用的「拒絕」機制。

對西方實驗室的經濟威脅

DeepSeek 的興起已經在股市引發震盪,影響了美國晶片製造商和 AI 公司的估值。通過免費或以顯著較低的 API 成本提供高性能模型,DeepSeek 挑戰了 OpenAI、Anthropic 和 Google 等公司的商業模式,這些公司依賴訂閱收入來資助其數十億美元的基礎設施項目。

如果蒸餾成為競爭對手追趕的常態化路徑,私人資本資助昂貴「前沿」研究的動力可能會減弱。OpenAI 向國會的呼籲表明,他們不僅將此視為違反服務條款,而且將其視為對美國創新生態系統的系統性威脅,需要立法或監管干預。

行業反應與未來展望

這些指控在技術社群中引發了激烈辯論。開源 AI 的支持者認為,分析模型輸出是標準做法,「向最強者學習」是科學進步的基本驅動力。然而,批評者指出,自動化、大規模的提取違反了幾乎所有商業 AI 提供商的合約服務條款。

DeepSeek 尚未對這些具體指控發表詳細的公開反駁,儘管該公司此前將其成功歸功於高效的代碼編寫和專門為推理優化設計的新穎架構。

隨著美國眾議院特設委員會審核這些指控,業界預計政策可能會發生轉向。這些政策可能涵蓋從針對 AI API 訪問的更嚴格「了解你的客戶」(KYC)要求,到旨在防止模型權重和推理軌跡數位出口的新貿易限制。

對於 Creati.ai 而言,這一持續發展的故事強調了在生成式 AI(Generative AI)時代保護 知識產權(Intellectual Property) 的至關重要性。隨著模型功能變得越來越強大,靈感與盜竊之間的界限正成為全球技術競爭的新前線。

精選