AI News

重塑智能:Google DeepMind 的新認知框架(Cognitive Framework)

在過去幾年裡,邁向通用人工智慧(Artificial General Intelligence,AGI)的競逐很大程度上被定義為在靜態、基於知識的基準測試(Benchmarks)中追求更高分數。雖然這些指標在衡量大型語言模型快速演進方面發揮了作用,但由於它們容易受到數據污染,且無法捕捉真正通用智能的細微差別,因此受到越來越多的批評。Google DeepMind 目前正尋求轉變這一範式,透過新發布的認知分類法(Cognitive Taxonomy),揭示了一種嚴謹且有科學支持的方法來衡量 AI 的進展。

這項倡議在論文「衡量邁向 AGI 的進展:一種認知分類法」中得到了詳細闡述,它超越了單純的知識檢索。它提出了一種評估 AI 系統的根本性重構,將「通用智能」的評估錨定在認知科學、神經科學和心理學的既定原則中。為了催化這一轉型,Google DeepMind 還啟動了一場獎金達 20 萬美元的 Kaggle 黑客松(Hackathon),邀請全球研究社群協助建立必要的基準測試基礎設施。

10 項能力的認知分類法

這一新框架的核心在於將通用智能分解為十種離散的認知能力。此分類法旨在提供 AI 系統運作方式的全方位視角,而不僅僅是它所知道的內容。透過將智能解構為這些特定的能力,研究人員可以更精確地找出不同架構的優點和缺點。

提議的分類法包括以下關鍵能力:

  • 感知(Perception):從環境中提取和處理複雜感官資訊的能力。
  • 生成(Generation):產生輸出的能力,包括文本、語音和可執行的動作。
  • 注意(Attention):在雜訊中將認知資源集中在相關刺激上的技能。
  • 學習(Learning):透過經驗、互動和指令獲取新知識的持續過程。
  • 記憶(Memory):在不同時間尺度上儲存、維護和檢索資訊的能力。
  • 推理(Reasoning):應用邏輯推斷從現有數據中得出有效結論。
  • 元認知(Metacognition):對自身內部認知過程進行了解和監測的高階能力。
  • 執行功能(Executive Functions):對計劃、抑制和認知靈活性的協調。
  • 問題解決(Problem Solving):在特定領域背景下尋找有效解決方案的專門能力。
  • 社會認知(Social Cognition):解釋複雜的社會信號並在動態的人際交往情況中做出適當反應的能力。

評估範式的比較

為了理解這一轉變的重要性,將傳統基準測試方法與 DeepMind 團隊提出的新認知優先方法進行對比會很有幫助。

評估重點 傳統基準測試 認知分類法
主要目標 靜態知識檢索 動態認知表現
數據完整性 極易受到污染 透過生成式測試具備韌性
人類對齊 與測試分數相關 映射至人類認知分佈
系統視角 統一的性能評分 細粒度的能力拆解

從理論走向實踐:Kaggle 黑客松

雖然框架的發表提供了理論基礎,但 DeepMind 承認單憑框架是不夠的。挑戰在於創建具備可擴展性、穩健性且有意義的評估協議。為了彌合這一差距,Google DeepMind 已與 Kaggle 合作,啟動了一場名為「衡量邁向 AGI 的進展:認知能力」的高額獎金黑客松。

這場黑客松專門設計用於解決「評估差距」——即針對現代 AI 更複雜、抽象的能力,嚴重缺乏標準化測試的問題。競賽聚焦於目前評估方法最薄弱的五個核心賽道:

  1. 學習:測試 AI 有效內化並應用新資訊的能力。
  2. 元認知:評估 AI 對自身推理局限性的覺察。
  3. 注意:評估模型在複雜環境中保持對關鍵任務關注的能力。
  4. 執行功能:衡量在約束條件下的認知靈活性與規劃能力。
  5. 社會認知:評估解釋並參與細微社會互動的能力。

獎金池與物流安排

黑客松提供總計 20 萬美元的獎金池,以激勵高品質的提交。結構設計旨在獎勵特定賽道的卓越表現和整體的創新:

  • 賽道獎:為五個認知賽道中前兩名的提交作品提供各 10,000 美元的獎金。
  • 大獎:為整個競賽中絕對最佳的四個整體提交作品提供各 25,000 美元的獎金。

參與者將利用 Kaggle 的社群基準測試平台,讓他們能夠針對各種前沿 AI 模型測試自己的評估方法。提交窗口自 2026 年 3 月 17 日起至 4 月 16 日開放,最終結果預計於 2026 年 6 月 1 日公佈。

對 AGI 研究未來的影響

這一 認知框架 的引入代表了 AI 研究社群向前邁出了成熟的一步。透過認知科學的視角將「智能」的語言標準化,DeepMind 實際上提高了構成實質性進展的門檻。

這種方法最關鍵的方面之一是提議的三階段評估協議。透過從具人口代表性的樣本中收集人類基準線,並將 AI 表現映射到這些分佈中,研究人員可以創建一個歸一化分數,指示模型在特定領域相對於人類能力的表現。這對目前追求排行榜排名的做法是一項重大的改進,因為後者往往掩蓋了模型推理或可靠性方面的根本缺陷。

隨著行業日益接近 AGI 的理論里程碑,衡量內部「認知」進展的能力將變得與部署模型本身同樣重要。憑藉這一框架,Google DeepMind 不僅是在問「這個 AI 有多聰明?」,而且還提供了一套結構化、可驗證的方法論,以科學的嚴謹性來回答這個問題。對於研究人員和開發者來說,Kaggle 黑客松是一份公開邀請,邀請大家共同定義將塑造下一個人工智慧時代的指標。

精選
ThumbnailCreator.com
利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
VoxDeck
引領視覺革命的AI簡報製作工具
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
AirMusic
AirMusic.ai 可從文字提示生成高品質的 AI 音樂曲目,支援風格與情緒自訂,並能匯出分軌(stems)。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
FalcoCut
FalcoCut:基於網頁的 AI 平台,用於影片翻譯、虛擬人影片、語音複製、換臉與短影片生成。
Telegram Group Bot
TGDesk 是一款多合一的 Telegram 群組機器人,用於擷取潛在客戶、提升互動並擴展社群。
Seedance 2 AI
結合影像、影片、音訊與文字的多模態 AI 影片生成器,可創作具電影感的短片。
LTX-2 AI
開源的 LTX-2 能從文字或圖片提示快速生成具原生音頻同步的 4K 影片,且已具備生產就緒能力。
SOLM8
你可以呼叫並與之聊天的 AI 女友。真實語音對話並具備記憶。每一刻與她相處都特別。
Vertech Academy
Vertech 提供旨在幫助學生和教師有效學習與教學的人工智慧提示。

Google DeepMind 發布用以衡量 AGI 進展的認知框架,並啟動獎金 $200,000 的 Kaggle 黑客松

Google DeepMind 發表了一篇科學論文,提出一套由 10 項能力組成的認知分類法,用以評估 AI 系統朝向 AGI 的進展;同時舉辦一場 Kaggle 黑客松,提供 $200,000 獎金以建立所需的評估基準。