- Structure d'environnement multi-agent
- Définitions modulaires d'agents et politiques
- Mécanismes de partage de récompenses personnalisables
- Algorithmes RL intégrés (DQN, PPO, A3C)
- Templates de scénarios et configurations dynamiques
- Gestion de la boucle d'entraînement et callbacks
- Journalisation des performances et visualisation