ビアゲーム環境は、4段階(小売業者、卸売業者、ディストリビューター、メーカー)のビールサプライチェーンを離散時間でシミュレートし、OpenAI Gymインターフェースを公開しています。エージェントは在庫、パイプライン在庫、着荷予定の注文を観測し、その後、注文量を出力します。環境は、在庫保持とバックオーダーにかかるコストを1ステップごとに計算し、Demand分布やリードタイムのカスタマイズをサポートします。Stable Baselines3などの人気RLライブラリとシームレスに連携し、研究者や教育者がサプライチェーンの最適化タスクでアルゴリズムをベンチマーク・訓練できるようにします。