Google DeepMind 在狼人殺與撲克上擴展 AI 基準測試,Gemini 3 主導排行榜
Google DeepMind 在 Kaggle Game Arena 推出狼人殺與撲克基準測試,以評估 AI 的社交能力、偵測欺騙與風險管理。Gemini 3 Pro 與 Flash 模型較前一代展現了顯著的性能躍升。
Google DeepMind 在 Kaggle Game Arena 推出狼人殺與撲克基準測試,以評估 AI 的社交能力、偵測欺騙與風險管理。Gemini 3 Pro 與 Flash 模型較前一代展現了顯著的性能躍升。