Pits and Orbsは、強化学習の研究と教育向けに設計された軽量なPythonベースの多エージェントグリッドワールド環境です。エージェントがグリッドをナビゲートし、致命的な落とし穴を避け、報酬のためにオーブを集め、競争または協力して相互に作用するターン制のゲームをシミュレートします。カスタマイズ可能なグリッドサイズと報酬設定により、多様なRLアルゴリズムの開発とベンチマークに適した柔軟なテストベッドを提供します。
Pits and Orbsは、強化学習の研究と教育向けに設計された軽量なPythonベースの多エージェントグリッドワールド環境です。エージェントがグリッドをナビゲートし、致命的な落とし穴を避け、報酬のためにオーブを集め、競争または協力して相互に作用するターン制のゲームをシミュレートします。カスタマイズ可能なグリッドサイズと報酬設定により、多様なRLアルゴリズムの開発とベンチマークに適した柔軟なテストベッドを提供します。
Pits and OrbsはPythonで実装されたオープンソースの強化学習環境で、ターン制のマルチエージェントグリッドワールドを提供します。エージェントは目標を追求し、危険な環境要素に直面します。各エージェントは設定可能なグリッド上をナビゲートし、ランダムに配置された落とし穴を避けてエピソードをペナルティ化または終了させ、ポジティブな報酬のためにオーブを収集します。この環境は競争モードと協力モードの両方をサポートし、研究者はさまざまな学習シナリオを探索できます。簡単なAPIはStable BaselinesやRLlibなどの人気RLライブラリにシームレスに統合可能です。主な特徴は、調整可能なグリッド寸法、ダイナミックな落とし穴とオーブの分布、設定可能な報酬構造、および訓練分析用のオプションログ記録です。