- Schritt 1: Das Repository von GitHub klonen.
- Schritt 2: Abhängigkeiten über pip (requirements.txt) installieren.
- Schritt 3: Eine Algorithmus-Konfigurationsdatei auswählen (DQN, PPO, A2C).
- Schritt 4: Umgebung und Hyperparameter in der Konfiguration anpassen.
- Schritt 5: Das Trainingsskript ausführen, um das Lernen zu starten.
- Schritt 6: Logs überwachen und Metriken mit TensorBoard visualisieren.
- Schritt 7: Das trainierte Modell mit dem Evaluierungsskript bewerten.