Pits and Orbs ist eine Open-Source-Umgebung für Verstärkendes Lernen, implementiert in Python, die eine rundenbasierte Multi-Agenten-Gitterswelt bietet, in der Agenten Zielsetzungen verfolgen und Umweltgefahren begegnen. Jeder Agent muss ein anpassbares Gitter navigieren, zufällig platzierte Fallen meiden, die Episoden bestrafen oder beenden, und Orbs für positive Belohnungen sammeln. Die Umgebung unterstützt sowohl Wettbewerbs- als auch Kooperationsmodi, sodass Forscher verschiedene Lernszenarien erkunden können. Ihre einfache API integriert sich nahtlos mit beliebten RL-Bibliotheken wie Stable Baselines oder RLlib. Zu den Hauptmerkmalen gehören anpassbare Gittergrößen, dynamische Fallen- und Orb-Verteilungen, konfigurierbare Belohnungsstrukturen und optionales Logging für das Trainings-Tracking.
Pits and Orbs Hauptfunktionen
Turn-based Multi-Agenten-Gittersimulation
Anpassbare Gittergröße und Layout
Zufällige Fallen und Orb-Belohnungen
Unterstützung für wettbewerblichen und kooperativen Modus
Java-Action-Storage ist eine Kernkomponente des LightJason-Frameworks für Mehragenten, die sich um die End-to-End-Persistenz von Agentenaktionen kümmert. Es definiert eine generische ActionStorage-Schnittstelle mit Adaptern für beliebte Datenbanken und Dateisysteme, unterstützt asynchrone und gebündelte Schreibvorgänge und verwaltet gleichzeitigen Zugriff von mehreren Agenten. Benutzer können Speicherstrategien konfigurieren, historische Aktionsprotokolle abfragen und Sequenzen für Audits oder Wiederholungen abspielen. Das Modul integriert sich über einfache Abhängigkeitsinjektion, um eine schnelle Adoption in Java-basierten KI-Projekten zu ermöglichen.