- Implementierungen von MADDPG, PPO und anderen Multi-Agenten-RL-Algorithmen
- Integration des AutoDRIVE-Simulators mit Szenarien für den Stadtverkehr
- Anpassbare Umwelt-Wrapper und Belohnungsfunktionen
- Trainings- und Bewertungs-Skripte mit Logging-Unterstützung
- Visualisierungs- und Leistungsdiagrammfunktionen
- Unterstützung für Curriculum-Learning und Policy-Checkpointing