Ce dépôt fournit une suite complète d'algorithmes d'apprentissage par renforcement multi-agent, comprenant MADDPG, DDPG, PPO et plus encore, intégrés avec des benchmarks standard tels que l'Environnement de Particules Multi-Agent et OpenAI Gym. Il comprend des wrappers d'environnements personnalisables, des scripts d'entraînement configurables, un enregistrement en temps réel et des métriques d'évaluation des performances. Les utilisateurs peuvent facilement étendre les algorithmes, les adapter à des tâches personnalisées et comparer les politiques dans des environnements coopératifs et adverses avec une configuration minimale.