- Création d'environnements multi-agents personnalisables
- Algorithmes RL pré-implémentés (DQN, PPO, MADDPG)
- Modes d'entraînement synchrones et asynchrones
- Modules de communication et de passage de messages entre agents
- Enregistrement d'expériences et intégration avec TensorBoard
- Scripts de visualisation et notebooks intégrés