- Estrutura de ambiente multiagente
- Definições modulares de agentes e políticas
- Mecanismos personalizáveis de compartilhamento de recompensas
- Algoritmos RL integrados (DQN, PPO, A3C)
- Modelos de cenário e configurações dinâmicas
- Gestão do ciclo de treino e callbacks
- Registro de desempenho e visualização