- Gerenciador de ambiente vetorizado para simulação paralela
- Implementações de PPO, A2C, DDPG e SAC
- Redes de política e valor configuráveis
- Suporte a aceleração GPU via PyTorch
- Loop de treinamento modular e sistema de callbacks
- Compatibilidade com OpenAI Gym