Pits and Orbs ist eine Open-Source-Umgebung für Verstärkendes Lernen, implementiert in Python, die eine rundenbasierte Multi-Agenten-Gitterswelt bietet, in der Agenten Zielsetzungen verfolgen und Umweltgefahren begegnen. Jeder Agent muss ein anpassbares Gitter navigieren, zufällig platzierte Fallen meiden, die Episoden bestrafen oder beenden, und Orbs für positive Belohnungen sammeln. Die Umgebung unterstützt sowohl Wettbewerbs- als auch Kooperationsmodi, sodass Forscher verschiedene Lernszenarien erkunden können. Ihre einfache API integriert sich nahtlos mit beliebten RL-Bibliotheken wie Stable Baselines oder RLlib. Zu den Hauptmerkmalen gehören anpassbare Gittergrößen, dynamische Fallen- und Orb-Verteilungen, konfigurierbare Belohnungsstrukturen und optionales Logging für das Trainings-Tracking.
Pits and Orbs Hauptfunktionen
Turn-based Multi-Agenten-Gittersimulation
Anpassbare Gittergröße und Layout
Zufällige Fallen und Orb-Belohnungen
Unterstützung für wettbewerblichen und kooperativen Modus
PommerLearn ermöglicht Forschern und Entwicklern das Training von Multi-Agenten-RL-Bots in der Pommerman-Umgebung. Es enthält einsatzfertige Implementierungen beliebter Algorithmen (PPO, DQN), flexible Konfigurationsdateien für Hyperparameter, automatische Protokollierung und Visualisierung von Trainingsmetriken, Modell-Checkpointing und Evaluierungsskripte. Die modulare Architektur erleichtert die Erweiterung durch neue Algorithmen, die Anpassung der Umgebung und die Integration mit standardmäßigen ML-Bibliotheken wie PyTorch.