AI News

App Store 的新巨頭:DeepSeek 的迅猛崛起

在一項震撼矽谷與全球人工智慧社群的發展中,行動 AI 的版圖一夜之間改變。DeepSeek,一家過去主要在研究圈內知名的中國 AI 新創公司,已躍升至 Apple 美國 App Store 免費應用排行榜的第一名。此一激增將長期稱霸的 OpenAI 的 ChatGPT 取代,標誌著消費者對生成式 AI(Generative AI)採用的一個關鍵時刻。

DeepSeek 應用的崛起不僅僅是下載數據的波動;它代表了對既有 AI 產業階層的一項根本挑戰。在釋出最新的開源(open-source)推理模型 DeepSeek R1 之後,那些尋求進階「推理」能力但又不願為西方競爭者支付高昂費用的使用者,紛紛湧入該應用,帶來龐大關注。

此一事件是中國 AI 應用首次在美國市場這麼明確地超越美國對手,並引發對硬體制裁效力、開源創新速度,以及 AI 可及性未來的深刻疑問。

激增背後的數字

各項指標描繪出當前市場動態的嚴峻景象。在部署 R1 模型的數日內,DeepSeek 應用已迅速超越 ChatGPT、Gmail 與 Instagram 等重量級應用,登上 iOS 排行榜榜首。雖然 ChatGPT 因為先發優勢在整體活躍用戶數上仍保持龐大領先,DeepSeek 的下載速度顯示出用戶興趣發生大規模轉移。

Sensor Tower 等追蹤公司的市場分析師指出,這波病毒式傳播看似屬於自然增長,主要由社群媒體口碑推動,而非大量廣告投放。像 X(前稱 Twitter)與 Reddit 等平台上的使用者,都在展示該應用解決複雜邏輯謎題、產生程式碼與處理數學證明的能力——這些任務通常需要付費的 ChatGPT「Plus」等級才能使用 OpenAI 的 o1 模型。

與 iOS 的成功同步,DeepSeek 在 Google Play 商店也顯著上升,衝進前 20 名並持續攀升。跨平台的動能顯示對高階推理 AI 的需求是普遍存在的,且使用者越來越不拘泥平台,而是傾向於以最低摩擦點獲取最有能力的模型。

DeepSeek R1:所謂的「推理」引擎

這次爆紅的催化劑無疑是 DeepSeek R1 模型。與傳統的大型語言模型(Large Language Models,LLMs)僅根據統計機率預測下一個詞不同,R1 採用了「思維鏈(Chain-of-Thought,CoT)」過程。這使得 AI 在「說出答案」前先行「思考」,將複雜查詢拆解為中間步驟,驗證自身邏輯,並在即時修正錯誤後再呈現最終答案。

這項能力過去是保護 OpenAI 的 o1 模型(代號「Strawberry」)的護城河。然而據報導,DeepSeek R1 在若干關鍵基準測試,特別是在數學與程式碼方面,已匹敵或超越 o1,同時保持完全開源(open-source)。

技術區別

R1 的差異在於其透明性。當使用者提出困難問題時,應用可以顯示「思考過程」——也就是 AI 為達到解答所採用的內部獨白。對於同樣重視「如何做」而非僅重視「做了什麼」的開發者與學生,這個功能極受歡迎。

此外,DeepSeek 採用了稱為「蒸餾(distillation)」的技術,來創造更小且高效的 R1 版本。這些較小的模型可以在消費等級硬體上執行,實際上使過去僅限於龐大伺服器群的智慧變得民主化。

效率的經濟學:以更少做更多

或許 DeepSeek 故事中最具顛覆性的,不是應用本身,而是其背後的經濟學。報導指出,訓練 DeepSeek R1 的成本僅為 GPT-4 或 Gemini Ultra 等模型所需成本的一小部分。

業界估計顯示,當美國科技巨頭為訓練前沿模型花費超過 1 億美元時,DeepSeek 以大約 600 萬美元的訓練成本完成了可比的結果。此效率透過一個由 2,048 顆 Nvidia H800 GPU 組成的叢集實現——這些晶片因美國出口管制而在技術上有性能上限。

這場「效率衝擊」挑戰了「越大越好」的既有敘事。它顯示演算法創新可以彌補硬體上的限制,這一認識已令硬體製造業的投資者感到恐慌。若智慧變得廉價可生產,為兆級基礎設施建設辯護的理由將遭到嚴重質疑。

比較:DeepSeek R1 vs. ChatGPT(o1/4o)

要理解競爭格局,比較目前爭奪 App Store 冠軍的兩大競爭者是有幫助的。

Feature/Metric DeepSeek R1 OpenAI ChatGPT (o1/4o)
Core Capability 推理(思維鏈) 推理與多模態
License Type 開源(MIT License) 封閉原始碼(專有)
Training Cost (Est.) 約 $6 Million >$100 Million(業界估計)
Hardware Base Nvidia H800(受限晶片) Nvidia H100(無限制叢集)
Consumer Cost 免費(應用/網頁) 免費方案/$20/月 Plus 等級
Transparency 可見的思考過程 隱藏的內部邏輯

地緣政治與市場漣漪

DeepSeek 的崛起已帶來即時的金融影響。隨著該應用稱霸與其低訓練成本的消息傳出,美國晶片股出現顯著波動。作為 AI 熱潮的風向標,Nvidia 的股價在投資者重新評估高端 GPU 需求可能並非無限的情況下出現下滑。若競爭性模型能以舊有或受限硬體、且成本僅為一小部分的方式構建,透過巨量運算群所形成的「護城河」便開始消失。

此外,這一事件也對美國出口管制的效力提出強烈反駁。即便被禁止取得最尖端的矽晶片,中國工程師仍展示出藉由優化軟體架構以縮小性能差距的能力。此一發展迫使美國政策制定者與科技領袖重新考量 AI 軍備競賽的動態:它不再僅僅是硬體之戰,而是建築效率之爭。

開源社群的回應

對於開源社群來說,DeepSeek R1 是一個分水嶺。多年來,「開放」模型(例如 Llama)與「封閉」前沿模型(例如 GPT-4)之間存在顯著差距。DeepSeek 已實際上縮短甚至摧毀了這道差距。

藉由在 MIT License 下釋出模型權重,DeepSeek 賦能全球開發者在其基礎上構建。我們已見到大量「R1 蒸餾」模型在像 Hugging Face 這樣的平台上出現,並針對從醫療診斷到創意寫作的各種用途進行優化。這種由全球開發者社群驅動的快速迭代循環,對依賴 API 訂閱為收入來源的封閉生態系構成嚴重威脅。

隱私與安全考量

像任何外國應用在美國市場迅速崛起一樣,關於資料隱私的審視在所難免。雖然 DeepSeek 的原始碼是開源的,但其行動應用仍依循標準的資料收集政策。企業與政府部門的使用者很可能會保持謹慎,因為合規與資料主權需求,他們仍傾向採用 Microsoft 與 OpenAI 提供的企業級解決方案。

然而對於一般消費者而言,實用性目前似乎勝過地緣政治的顧慮。免費且「更聰明」的聊天機器人的吸引力正推動下載數,顯示在消費者領域,性能是衡量成功的最終仲裁者。

結論:給產業的一記警鐘

DeepSeek 在 App Store 超越 ChatGPT 不只是一時的病毒式現象;它發出訊號,表明 AI 產業正進入新階段。單一玩家無可爭議的主導時代正在結束。我們正朝向一個多極化的 AI 世界邁進,開源效率將直接與封閉規模競爭。

對於 OpenAI、Google 與 Anthropic 而言,壓力現在有兩重:他們不僅要推進能力的邊界,還必須回應 DeepSeek 所建立的無情性價比。對消費者來說,未來看起來光明——而且愈來愈智慧、可及且負擔得起。

精選