simple_rl es una biblioteca Python minimalista diseñada para agilizar la investigación y educación en aprendizaje por refuerzo. Ofrece una API coherente para definir entornos y agentes, con soporte incorporado para paradigmas RL comunes como Q-learning, Monte Carlo y algoritmos de programación dinámica como iteración de valores y políticas. El marco incluye entornos de ejemplo como GridWorld, MountainCar y Multi-Armed Bandits, facilitando experimentación práctica. Los usuarios pueden extender clases base para implementar entornos o agentes personalizados, mientras que funciones utilitarias manejan el registro, seguimiento de rendimiento y evaluación de políticas. La arquitectura ligera y código claro de simple_rl lo hacen ideal para prototipado rápido, enseñanza de fundamentos de RL y benchmarking de nuevos algoritmos en un entorno reproducible y fácil de entender.