- Definições modulares de ambiente e agente
- Suporte para algoritmos PPO, DQN, A2C
- Funções de recompensa e comunicação personalizáveis
- Visualização em tempo real de interações de agentes
- Configuração de hiperparâmetros e utilitários de registro
- Compatibilidade com OpenAI Gym