Google DeepMind élargit l'évaluation des IA avec Werewolf et le poker alors que Gemini 3 domine les classements
Google DeepMind lance des benchmarks Werewolf et poker sur Kaggle Game Arena pour tester les compétences sociales des IA, la détection de la tromperie et la gestion des risques. Les modèles Gemini 3 Pro et Flash montrent un bond de performance significatif par rapport à la génération précédente.


