- Vorgefertigte Algorithmen: Q-Learning, Monte Carlo, Wertiteration, Politik-Iteration
- Mehrere Beispielumgebungen: GridWorld, MountainCar, Multi-Armed Bandits
- Einheitliche Agenten-Umgebungs-Schnittstelle mit Basisklassen
- Hilfsfunktionen für Logging, Leistungsüberwachung und Visualisierung
- Modulares und erweiterbares Design für individuelle Agenten/Umgebungen