AI News

Meta 的 Superintelligence Labs 發表「Avocado」與「Mango」:轉向自治世界模型(autonomous world models)

DAVOS — 為了決定性地重奪其在人工智慧前沿的地位,Meta Platforms 已針對其祕密的 Superintelligence Labs(MSL)首次重大成果打破沉默。本週在達沃斯世界經濟論壇(World Economic Forum)發言時,CTO Andrew Bosworth 透露公司在兩個不同的 AI 模型方面取得了重大的內部突破:Project Avocado,一款為高階推理優化的次世代文字模型;以及 Project Mango,一套建立於「世界模型」(world model)架構上的視覺智慧系統。

此項公告標誌著 Meta 的關鍵轉捩點。繼 2025 年中 Llama 4 反響不一後,CEO Mark Zuckerberg 執行了大規模重組,在 Alexandr Wang 的領導下成立了 Superintelligence Labs。Avocado 與 Mango 的亮相表示 Meta 在積極的人才招募與基礎設施投資終於開始看到成效,並以 2026 年第一季為目標準備對外發佈。

The Superintelligence Mandate:策略性轉向

Meta Superintelligence Labs 的成立代表公司 AI 哲學的根本轉變。MSL 的任務從早期 Llama 世代以產品整合為主,改為以單一目標為核心:達成「自治」(autonomy)與「深度推理」(deep reasoning)。

在達沃斯揭露的路線圖顯示,Meta 不再滿足於僅僅為 Instagram 與 WhatsApp 提供聊天機器人動力。公司正在轉向所謂的「代理型」(agentic)系統——能夠規劃、推理並在長時間尺度上執行複雜任務的 AI。

「產業在增量擴充上撞牆了,」Bosworth 在演說中指出。「有了 Avocado 與 Mango,我們不只是預測下一個 token;我們在模擬物理與數位世界的底層邏輯。」

Project Avocado:精通程式與邏輯

Project Avocado 代表了 Meta 對軟體開發與複雜邏輯推理日益增長需求的直接回應。與先前作為通用 omni-model 的前代不同,Avocado 已專門微調以解決困擾先前開源模型的「推理落差」。

超越模式匹配

內部報告顯示,Avocado 採用了新穎架構,在預訓練階段即優先處理「思考鏈」(Chain of Thought,CoT),而不僅限於推論時使用。這讓模型能夠:

  • 自我修正程式碼:在無需人工介入的情況下,識別並修補軟體迴圈中的漏洞。
  • 多步驟規劃:將複雜的邏輯查詢拆解為可執行的子任務,其精確度優於 GPT-5 級模型。
  • 情境持續性:在顯著更長的上下文視窗中維持連貫的邏輯流,對於企業級應用至關重要。

藉由重點放在程式與邏輯上,Meta 旨在搶占日益被封閉源碼專有模型集中化的開發者市場。

Project Mango:視覺智慧的物理學

當 Avocado 處理抽象層面時,Project Mango 處理具體世界。Mango 被描述為「世界模型」(World Model,首次出現已註明原文)而非單純的影像生成器,設計目標是理解物理、因果關係與時間連續性。

「世界模型」的優勢

現有的生成式影片模型經常在「幻覺」情形中遭遇問題,物體會不現實地變形或違反重力。Project Mango 企圖透過與像素生成同步學習物理定律來解決此問題。

  • 時間一致性:Mango 生成的影片中,物體會在時間序列上維持其形狀、質量與速度。
  • 互動性:早期示範暗示使用者能「互動」生成場景,改變變數(如光源或物體位置)時,模型會即時重新計算物理結果。
  • 原生多模態:Mango 不只是文字轉影片;它接受影片輸入以分析並預測未來畫面,有效地扮演真實情境的模擬器。

比較分析:新競局

這些模型的推出讓 Meta 與業界現有領導者直接對峙。下表強調 Avocado 與 Mango 如何與現有生態系區分。

Table 1: Competitive Landscape Analysis (Projected Specs)

Model / Project Primary Focus Key Differentiator Target Architecture
Meta Project Avocado Logic & Coding Deep reasoning & self-correction CoT-Integrated Transformer
Meta Project Mango Visual Simulation Physics-based "World Model" Latent Diffusion + Physics Engine
OpenAI o-Series General Reasoning Broad knowledge base Reinforcement Learning
Google Gemini Ultra Multimodal Integration Native multimodal processing Mixture-of-Experts (MoE)

(註:表格內容保留專案與架構原文名稱以維持專有名詞一致性。)

對 AI 產業的策略性影響

Avocado 與 Mango 的發布不僅是產品發表;它還驗證了 Meta 所爭議的「強度之年」策略。引入像 Alexandr Wang 這類外部領導,以及對 H200 叢集的大量資本支出,似乎已在 Llama 4 的挫折後修正了方向。

開源問題

一個關鍵問題仍未解答:Meta 會開放 Avocado 與 Mango 的原始權重嗎?
歷來 Meta 支持開放權重。然而,這些模型的先進能力——特別是 Mango 在逼真模擬方面的潛力與 Avocado 在網路攻防上的能力——可能迫使策略改變。Bosworth 暗示可能採取「分級發佈」,將最具能力的版本保留給企業夥伴,或在更嚴格的安全許可下釋出。

發佈之路:2026 年第一季及以後

隨著接近計劃中的 2026 年第一季發佈,業界正準備迎接新一波競爭。Meta 向「世界模型」與「推理代理」的轉向顯示,下一個 AI 的戰場不僅是誰能生成最好的文字或影像,而是誰能建構最精準的現實模擬。

Development Timeline & Milestones

Phase Milestone Status Key Deliverables
Phase 1 Internal Training Completed Core model architecture validated; 100k+ GPU cluster utilization.
Phase 2 Red Teaming In Progress Safety alignment; Adversarial testing for coding vulnerabilities.
Phase 3 Partner Beta Q1 2026 (Planned) API access for select enterprise partners; Integration into Ray-Ban Meta smart glasses.
Phase 4 Public Release H1 2026 Open weight release (TBD) or general API availability.

對於開發者與企業來說,達沃斯傳遞的訊息很明確:Meta 已重返競賽,而且這一次,他們打造的是一個 AI 不僅會聊天——而是會行動的世界。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
InstantChapters
即時生成吸引人的書籍章節。
Claude API
Claude API for Everyone
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

Meta 的超級智能實驗室宣布以「Avocado」與「Mango」AI 模型取得突破

Meta 的菁英超級智能實驗室在其新 AI 模型(代號 Project Avocado(文本)與 Project Mango(視覺))上取得重大突破,計劃於 2026 年第一季公開發布。