
人工智慧與高階影像製作的交會,本週在 2026 年聖丹斯影展(Sundance Film Festival)達到關鍵里程碑。 在雪覆的 Park City 山脈間,Google DeepMind 揭幕了 Dear Upstairs Neighbors,這部動畫短片不只是敘述一個故事——它重寫了生成式AI(Generative AI)如何整合進專業動畫製作流程的規則。
在聖丹斯學院(Sundance Institute)的「Story Forum」首映時,這部影片標誌著與過去兩年佔據科技頭條的「文字到影片」(text-to-video)示範的重大分歧。 該計畫沒有依賴隨機提示,而是採用了由 Google 的 Veo 模型驅動的先進「視訊到視訊」工作流程,讓一支經驗豐富的動畫師團隊在運用 AI 承擔大量渲染與風格化工作的同時,仍能保持精準的導演控制。
由 Pixar 資深人員 Connie He(Inside Out 2、Watermelon: A Cautionary Tale)執導,並由 Yingzong Xin(Turning Red、Soul)擔任製作設計,該片作為「以藝術家為先」的生成式媒體(生成式AI)方法的概念驗證。 它展示了生成式媒體的未來不是取代人類創意,而是構建能解讀並放大人類表演細微差異的工具。
數十年來,動畫產業仰賴一個勞力密集的流程,每一幀都需要手動渲染、打光與合成。Dear Upstairs Neighbors 透過引入結合傳統敘事工藝與 Veo 生成能力的混合工作流程,挑戰了這種現狀。
影片講述失眠的年輕女子 Ada,因樓上吵雜的鄰居而陷入一場超現實、幻覺般的理智保衛戰。 為了讓這個混沌且畫意的世界活現於世,團隊並未僅僅輸入像「女孩對著天花板生氣」的提示。 相反地,他們開發了一套新穎流程,動畫師在標準 3D 軟體中表演場景或創作粗糙、方塊狀的動畫。 這些「參考視訊」成為 AI 的結構骨幹。
DeepMind 的研究人員與創作團隊並肩合作,對 Veo 與 Imagen 模型在一個精心策劃的、本片專屬概念藝術資料集上進行微調。 這確保當 AI 處理粗略動畫時,它不會僅僅猜測風格——而是套用製作設計師 Yingzong Xin 所定義的精確筆觸、色彩調和與光線邏輯。
其結果是一套在生成速度與手工動畫精準度之間搭起橋樑的工作流程。
Comparison: Traditional vs. DeepMind Veo-Assisted Workflow
| Workflow Stage | Traditional 3D Animation | Veo-Assisted Hybrid Workflow |
|---|---|---|
| Concept & Storyboard | Manual sketching and iteration | Manual sketching + AI style exploration |
| Blocking & Layout | Rough 3D posing and camera work | Rough 3D posing / Live-action reference |
| Rendering & Texturing | Complex lighting/shader setup per frame | AI Style Transfer via Fine-Tuned Veo |
| Iteration Speed | Hours/Days per second of footage | Minutes per iteration (near real-time) |
| Final Polish | Compositing layers and VFX | 4K Upscaling & Consistency refinement |
AI 影片生成最持久的批評之一是「時間不穩定性」——角色會在幀與幀之間閃爍、變形或改變外觀。Dear Upstairs Neighbors 透過嚴格的模型微調正面迎擊這項問題。
DeepMind 團隊將 Veo 模型客製化,以理解角色 Ada 的特定幾何與美學。 通過在一套小而高品質的「表情表」與關鍵藝術素材上訓練模型,AI 學會將該角色視為一致的 3D 實體,而非一系列無關的影像。 這讓動畫師能夠將角色表情推向極端、風格化的極限,而不會破壞連貫性的幻覺。
此外,團隊採用了類似傳統製作的 dailies 系統。 若 Veo 生成的鏡頭不完全合適,並非靠重擲隨機種子解決。 團隊使用區域化精修工具,允許他們遮罩視訊中的特定區域——例如手勢或臉部表情——並在保持畫面其餘部分鎖定的同時請求調整。 這種粒度的控制是將技術示範與可投入生產工具區分開來的關鍵。
最終輸出隨後使用 Veo 的增強功能進行 4K 放大,確保影片符合在聖丹斯銀幕首映所需的高視覺標準。
好萊塢關於 AI 的敘事常帶有恐懼——害怕失業與人類藝術性的侵蝕。 然而,Dear Upstairs Neighbors 的製作顯示另一條前進路徑。 該片並非在真空中「由 AI 製作」;它是由一群人類藝術家製作,並利用 AI 更有效率地執行他們的視覺理念。
「我們期望讓動畫藝術家能夠從生成式AI(Generative AI)的創意潛能中獲益,同時不必將藝術控制權拱手讓給其固有的不確定性,」Google DeepMind 團隊在首映隨附聲明中如是表示。
當輸入機制從文字(抽象且不精確)轉向視訊(捕捉時機、節奏與表演)時,這項技術成為一個翻譯者而非作者。 動畫師仍然是數位面具後的表演者。 這種工作流程讓較小的團隊能達成通常需要數百名渲染藝術家與龐大運算資源的「大片」視覺品質。
影展中的產業分析師指出,這一轉變可能使高階動畫民主化。 獨立創作者常有敘事技巧但缺乏高保真渲染的預算,他們可以使用類似的工作流程來製作近乎商業等級的內容。
Dear Upstairs Neighbors 中展示的技術並不會被封鎖於幕後。 Google 宣布,片中示範的 4K 放大與視訊到視訊能力將於本月稍晚整合到 Google AI Studio 與 Vertex AI 中。 這一舉動把專業級的生成工具直接交到工作室與開發者手中。
隨著製作與後製之間的界線逐漸模糊,動畫師的角色也在演變。 他們正成為生成系統的「指揮」,引導 AI 執行繁瑣的材質與光照工作,同時專注於表演的靈魂——時機、情感與故事。
聖丹斯一直是支持獨立聲音與實驗性敘事的影展。 隨著 Dear Upstairs Neighbors 的首映,它也成為新電影時代的發射台——在這個時代裡,矽與靈魂齊心協力,創造出如同「會動的畫作」,以人類意圖的優雅起舞。