- Schritt 1: Klonen Sie das Repository von GitHub oder installieren Sie es per pip.
- Schritt 2: Importieren Sie das Umgebungsmodul in Ihr Python-Skript.
- Schritt 3: Erstellen Sie ein Szenario anhand des Namens oder mit Ihrer eigenen Konfiguration.
- Schritt 4: Setzen Sie die Umgebung zurück und führen Sie Simulationsschritte aus, um Beobachtungen, Aktionen und Belohnungen zu sammeln.
- Schritt 5: Integrieren Sie es in die RL-Trainingsschleife für Politik-Updates.
- Schritt 6: Rendern Sie die Umgebung oder protokollieren Sie Metriken für die Analyse.