- Implementações de MADDPG, PPO e outros algoritmos de RL multiagente
- Integração do simulador AutoDRIVE com cenários urbanos de direção
- wrappers ambientais personalizáveis e funções de recompensa
- Scripts de treinamento e avaliação com suporte a registro
- Utilitários de visualização e gráficos de desempenho
- Suporte a aprendizagem por currículo e checkpointing de políticas