simple_rl é uma biblioteca minimalista em Python projetada para agilizar a pesquisa e educação em aprendizado por reforço. Ela fornece uma API consistente para definir ambientes e agentes, com suporte embutido para paradigmas comuns de RL, incluindo Q-learning, métodos de Monte Carlo e algoritmos de programação dinâmica como iteração de valores e de políticas. A estrutura inclui ambientes de exemplo como GridWorld, MountainCar e Multi-Armed Bandits, facilitando experimentação prática. Os usuários podem estender classes básicas para implementar ambientes ou agentes personalizados, enquanto funções utilitárias cuidam de registro, acompanhamento de desempenho e avaliação de políticas. A arquitetura leve de simple_rl e sua base de código clara a tornam ideal para prototipagem rápida, ensino dos fundamentos de RL e benchmarking de novos algoritmos em um ambiente reprodutível e de fácil compreensão.