Google DeepMind expande a avaliação de IA com Werewolf e poker enquanto Gemini 3 domina os rankings
Google DeepMind lança benchmarks de Werewolf e poker na Kaggle Game Arena para testar habilidades sociais da IA, detecção de enganos e gestão de riscos. Os modelos Gemini 3 Pro e Flash demonstram um salto de desempenho significativo em relação à geração anterior.


