- Implementações de agentes pré-construídos (DQN, PPO, SAC, etc.)
- Buffers de Replay modulares e wrappers de ambientes
- Laços de treinamento configuráveis e agendadores
- Motor de execução distribuída para treinamento escalável
- Utilitários de registro e avaliação integrados
- Compatibilidade com TensorFlow e JAX
- Checkpointing e rastreamento de métricas