Google DeepMind, Werewolf와 포커로 AI 벤치마크 확대 — Gemini 3가 순위 장악
Google DeepMind는 Kaggle Game Arena에 Werewolf와 포커 벤치마크를 공개해 AI의 사회적 기술, 기만 탐지 및 위험 관리 능력을 테스트합니다. Gemini 3 Pro와 Flash 모델은 이전 세대에 비해 상당한 성능 향상을 보여주고 있습니다.
Google DeepMind는 Kaggle Game Arena에 Werewolf와 포커 벤치마크를 공개해 AI의 사회적 기술, 기만 탐지 및 위험 관리 능력을 테스트합니다. Gemini 3 Pro와 Flash 모델은 이전 세대에 비해 상당한 성능 향상을 보여주고 있습니다.