- Implementaciones de MADDPG, PPO y otros algoritmos de aprendizaje por refuerzo multi-agente
- Integración del simulador AutoDRIVE con escenarios urbanos de conducción
- Envoltorios de entorno y funciones de recompensa personalizables
- Scripts de entrenamiento y evaluación con soporte de registros
- Utilidades de visualización y gráficos de rendimiento
- Soporte para aprendizaje por currículo y puntos de control de políticas