- Implementierungen von Mean-Field-Q-Learning-Algorithmen
- Umgebungs-Wrapper für Particle World und Gridworld
- Skalierbare Trainingspipelines für Hunderte von Agenten
- Modulare Politiken, Trainings- und Bewertungsmodule
- GPU-Beschleunigung basierend auf PyTorch
- Integriertes Logging und Matplotlib-Visualisierung