- Implémentations de DQN et Double DQN
- Agents de politique-gradient comme PPO et A2C
- Wrappers d'environnements OpenAI Gym
- Hyperparamètres configurables
- Support de la journalisation et de TensorBoard
- Sauvegarde et chargement de points de contrôle du modèle