simple_rl est une bibliothèque Python minimaliste conçue pour rationaliser la recherche et l'éducation en apprentissage par renforcement. Elle offre une API cohérente pour définir des environnements et des agents, avec un support intégré pour les paradigmes RL courants comme Q-learning, Monte Carlo et les algorithmes de programmation dynamique tels que l'itération de valeur et de politique. Le cadre comprend des environnements d'exemple tels que GridWorld, MountainCar et Multi-Armed Bandits, facilitant l'expérimentation pratique. Les utilisateurs peuvent étendre les classes de base pour implémenter des environnements ou agents personnalisés, tandis que des fonctions utilitaires gèrent la journalisation, le suivi des performances et l'évaluation des politiques. La légèreté de simple_rl et la clarté du code en font un outil idéal pour le prototypage rapide, l'enseignement des fondamentaux du RL, et le benchmarking de nouveaux algorithmes dans un environnement reproductible et facile à comprendre.