El entorno Beer Game proporciona una simulación en tiempo discreto de una cadena de suministro de cerveza de cuatro etapas — minorista, mayorista, distribuidor y fabricante — con una interfaz de OpenAI Gym. Los agentes reciben observaciones que incluyen inventario en mano, stock en línea y pedidos entrantes, y luego producen cantidades de pedidos. El entorno calcula los costos por paso de mantenimiento de inventario y pedidos pendientes, y admite distribuciones de demanda y tiempos de entrega personalizables. Se integra perfectamente con bibliotecas RL populares como Stable Baselines3, permitiendo a investigadores y educadores evaluar y entrenar algoritmos en tareas de optimización de la cadena de suministro.