
By Creati.ai Editorial Team
在拉斯維加斯舉行的 CES 2026,上空充斥著一如既往的科技樂觀氛圍,但有一項宣佈以雷射感測器般的精準切穿噪音。Nvidia 執行長 Jensen Huang 登台,不僅是為了發表一款新晶片,更是宣告人工智慧發展路徑的一次根本性轉變。Huang 宣稱:「面向實體世界的 ChatGPT 時刻已經到來」,這代表 AI 不再只是生成文字與影像,而是能理解、推理並在物理世界中採取行動。
這項宣告同時公布了 Alpamayo,Nvidia 的突破性技術,旨在為自駕車(AVs)帶來類似人類的推理能力。隨著數位與實體世界的融合,Nvidia 正定位自己為到 2030 年預估 13.6 兆美元自主市場的基礎建構者,而機器人計程車將成為首批主要受益者。
過去幾年,全世界被生成式AI(Generative AI)所吸引——這類模型主要存在於數位領域。Huang 將其比擬為 ChatGPT,並非僅是行銷口號;而是指出一個具體的技術飛躍。正如大型語言模型(LLMs)賦予電腦處理與生成複雜語言的能力,實體AI(Physical AI)讓機器能夠感知複雜環境,並即時地進行推理。
自動駕駛的核心挑戰一直是邊緣情況的「長尾」——例如罕見且難以預測的事件,像是工人比手勢將車流引入迎面車道,或是在暴雨中穿梭的行為異常的自行車騎士。傳統的自駕堆疊仰賴僵硬的規則式決策程式,在這些微妙情境中經常失靈。
由視覺-語言-行動(視覺-語言-行動(Vision-Language-Action,VLA))模型驅動的實體AI,改變了此一範式。它讓車輛不只「看見」障礙,而是「理解」情境並「推理」出解決方案,類似人類駕駛的方式。
此一突破的核心為 Alpamayo 系列開源 AI 模型。Alpamayo 以秘魯安第斯山脈中那座醒目的山峰命名,旨在征服自主領域中最陡峭的挑戰。它是業界第一個以推理為基礎、專為 Level 4 自主(Level 4 autonomy)設計的 VLA 模型。
不同於先前世代將感知(看見)與規劃(決定)分開處理的自駕技術,Alpamayo 將這些功能整合為一致的「思路鏈」過程。這讓系統能夠分析因果關係。例如,如果球滾入街道,Alpamayo 不只是為了障礙而煞車;它會推斷可能有孩子跟上,並相應地調整風險評估。
CES 2026 宣布的技術套件包含三大關鍵支柱:
下表概述了傳統自主方法與由 Alpamayo 驅動的新範式之間的關鍵差異:
Table: Evolution of Autonomous Vehicle Architectures
| Feature | Traditional AV Stack | Nvidia Alpamayo VLA |
|---|---|---|
| Core Architecture | Modular (Perception, Localization, Planning separated) | End-to-End Vision-Language-Action (VLA) |
| Decision Making | Rule-based logic trees | Chain-of-thought reasoning |
| Edge Case Handling | Fails or disengages in undefined scenarios | Reasons through novel scenarios using context |
| Data Processing | Deterministic processing of sensor inputs | Probabilistic understanding of scene dynamics |
| Transparency | Black-box decision making | Reasoning traces explain 「Why」 a move was made |
雖然像新發表的 Mercedes-Benz CLA 這類消費者車款將是首批搭載 Nvidia 完整自駕堆疊的車型,Huang 明確指出,機器人計程車才是這個新智慧時代的主要目標。機器人計程車市場的經濟模型仰賴移除人類安全駕駛員,然而由於安全疑慮,這一目標一直難以實現。
透過解決推理缺口,Alpamayo 目標提供真正無人駕駛所需的安全冗餘。Huang 預測,機器人計程車將開啟一個價值數兆美元的移動即服務經濟。Fortune Business Insights 預估,這個更廣泛的自主車市場到 2030 年將達到 13.6 兆美元,涵蓋從叫車服務到自動化物流的各種業務。
Nvidia 的策略有別於像 Tesla 之類的競爭者。Nvidia 並非建造封閉生態系,而是扮演「自主領域的 Android」,提供基礎設施——晶片、模擬與基礎模型——讓其他公司(例如 Uber、Lucid 與 Jaguar Land Rover)可以建立自己的車隊。這種生態系策略加速採用,並將 Nvidia 的硬體建立為行業標準。
產業對 Alpamayo 的反應是立竿見影的。主要業者已開始整合該技術:
然而,挑戰依然存在。轉向實體AI 需要龐大的運算能力,無論是在資料中心進行訓練,或是在車內執行推論。這意味著車載硬體需不斷升級,短期內可能提高車輛成本。此外,監管機構必須被說服「具備推理能力」的 AI 比人類駕駛更安全;Nvidia 以其設計來驗證 AI 決策的「Halos」安全框架來回應這一障礙。
在 Creati.ai,我們認為 Alpamayo 的推出不僅是自駕車的一次升級,而是對實體AI(Physical AI)作為一個獨立且重要類別的驗證。Jensen Huang 的宣佈證實,下一個 AI 的前沿不僅僅關乎聊天機器人或影像生成器——而是關乎具身智慧,能在我們混亂的三維現實中導航。
隨著我們邁向 2030,機器的推理能力將重新定義人類與交通的關係。這個針對原子(atoms)而非位元(bits)的「ChatGPT 時刻」已經來臨,道路前景從根本上不同。