- Criação de ambientes multiagente personalizáveis
- Algoritmos RL pré-implementados (DQN, PPO, MADDPG)
- Modos de treinamento síncronos e assíncronos
- Comunicação entre agentes e módulos de passagem de mensagens
- Registro de experimentos e integração com TensorBoard
- Scripts de visualização e notebooks embutidos