- Implémentations d’algorithmes Q-learning par champ moyen
- Wrappers d’environnement pour Particle World et Gridworld
- Pipeline d’entraînement évolutif pour des centaines d'agents
- Modules de politique, d’entraînement et d’évaluation modulaires
- Accélération GPU basée sur PyTorch
- Journalisation intégrée et visualisation Matplotlib