Pits and Orbs ist eine Open-Source-Umgebung für Verstärkendes Lernen, implementiert in Python, die eine rundenbasierte Multi-Agenten-Gitterswelt bietet, in der Agenten Zielsetzungen verfolgen und Umweltgefahren begegnen. Jeder Agent muss ein anpassbares Gitter navigieren, zufällig platzierte Fallen meiden, die Episoden bestrafen oder beenden, und Orbs für positive Belohnungen sammeln. Die Umgebung unterstützt sowohl Wettbewerbs- als auch Kooperationsmodi, sodass Forscher verschiedene Lernszenarien erkunden können. Ihre einfache API integriert sich nahtlos mit beliebten RL-Bibliotheken wie Stable Baselines oder RLlib. Zu den Hauptmerkmalen gehören anpassbare Gittergrößen, dynamische Fallen- und Orb-Verteilungen, konfigurierbare Belohnungsstrukturen und optionales Logging für das Trainings-Tracking.