O ambiente Beer Game fornece uma simulação em tempo discreto de uma cadeia de suprimentos de cerveja de quatro etapas — varejista, atacadista, distribuidor e fabricante — com uma interface OpenAI Gym. Os agentes recebem observações incluindo estoque disponível, estoque em pipeline e pedidos recebidos, e produzem quantidades de pedido. O ambiente calcula custos por etapa para armazenamento e pedidos pendentes, e suporta distribuições de demanda e tempos de entrega personalizáveis. Ele se integra perfeitamente com bibliotecas RL populares como Stable Baselines3, permitindo que pesquisadores e educadores avaliem e treinem algoritmos para tarefas de otimização da cadeia de suprimentos.