- Arquitetura modular de agentes para políticas personalizadas
- Integração com ambientes OpenAI Gym
- Suporte para os backends TensorFlow e PyTorch
- Treinamento centralizado com execução descentralizada
- Utilitários para replay de experiência e treinamento distribuído multi-GPU
- Configuração via YAML e scripts Python
- Ferramentas de registro e visualização para análise de métricas
- Modelos de cenário pré-construídos para cooperação e competição