Google DeepMind erweitert das KI-Benchmarking um Werewolf und Poker, während Gemini 3 die Ranglisten dominiert
Google DeepMind führt auf der Kaggle Game Arena Benchmarks für Werewolf und Poker ein, um soziale Fähigkeiten von KI, Täuschungserkennung und Risikomanagement zu testen. Die Modelle Gemini 3 Pro und Flash zeigen einen deutlichen Leistungssprung gegenüber der vorherigen Generation.


