Google DeepMind amplía la evaluación de IA con Werewolf y poker mientras Gemini 3 domina las clasificaciones
Google DeepMind lanza benchmarks de Werewolf y poker en Kaggle Game Arena para probar las habilidades sociales de la IA, la detección del engaño y la gestión del riesgo. Los modelos Gemini 3 Pro y Flash demuestran un salto de rendimiento significativo respecto a la generación anterior.


