- Simulation d'environnements parallèles accélérée par GPU
- Algorithmes MARL intégrés (PPO, MADDPG, QMIX, COMA)
- Interfaces modulaires pour l'environnement et la politique
- Support pour la formation centralisée avec exécution décentralisée
- Personnalisation du façonnage des récompenses et hooks de rappel