Google DeepMind расширяет бенчмаркинг ИИ с Werewolf и покером, пока Gemini 3 доминирует в рейтингах
Google DeepMind запускает бенчмарки Werewolf и покера на Kaggle Game Arena, чтобы проверять социальные навыки ИИ, обнаружение обмана и управление рисками. Модели Gemini 3 Pro и Flash демонстрируют значительный скачок производительности по сравнению с предыдущим поколением.


