- Vektorbasierter Umgebungsmanager für parallele Simulation
- Implementierungen von PPO, A2C, DDPG und SAC
- Konfigurierbare Policy- und Wertnetzwerke
- GPU-Beschleunigung mit PyTorch
- Modularer Trainingsloop und Callback-System
- Kompatibilität mit OpenAI Gym