Beer Game 환경은 4단계(소매점, 도매상, 유통업체, 제조사) 맥주 공급망을 이산 시간으로 시뮬레이션하며, OpenAI Gym 인터페이스를 제공합니다. 에이전트는 재고, 파이프라인 재고, 수신 주문에 대한 관측값을 받고, 주문 수량을 출력합니다. 환경은 매 단계의 재고 보유 및 백오더 비용을 계산하며, 사용자 요구에 따른 분포와 리드타임을 지원합니다. Stable Baselines3와 같은 인기 RL 라이브러리와 원활하게 통합되어 연구자와 교육자가 공급망 최적화 작업에서 알고리즘을 벤치마크하거나 훈련할 수 있습니다.