Herramientas bibliotecas de RL de alto rendimiento

Accede a soluciones bibliotecas de RL que te ayudarán a completar tareas complejas con facilidad.

bibliotecas de RL

  • Un entorno de OpenAI Gym en Python que simula la cadena de suministro del Juego de la Cerveza para entrenar y evaluar agentes RL.
    0
    0
    ¿Qué es Beer Game Environment?
    El entorno Beer Game proporciona una simulación en tiempo discreto de una cadena de suministro de cerveza de cuatro etapas — minorista, mayorista, distribuidor y fabricante — con una interfaz de OpenAI Gym. Los agentes reciben observaciones que incluyen inventario en mano, stock en línea y pedidos entrantes, y luego producen cantidades de pedidos. El entorno calcula los costos por paso de mantenimiento de inventario y pedidos pendientes, y admite distribuciones de demanda y tiempos de entrega personalizables. Se integra perfectamente con bibliotecas RL populares como Stable Baselines3, permitiendo a investigadores y educadores evaluar y entrenar algoritmos en tareas de optimización de la cadena de suministro.
    Características principales de Beer Game Environment
    • Entorno compatible con OpenAI Gym
    • Simula roles de minorista, mayorista, distribuidor y fabricante
    • Distribuciones de demanda y tiempos de entrega personalizables
    • Cálculo de costos por paso para inventario y pedidos pendientes
    • Integración sin problemas con bibliotecas RL
  • Pits and Orbs ofrece un entorno de mundo en una cuadrícula multi-agente donde los agentes AI evitan trampas, recogen orbes y compiten en escenarios por turnos.
    0
    0
    ¿Qué es Pits and Orbs?
    Pits and Orbs es un entorno de código abierto para aprendizaje por refuerzo, implementado en Python, que ofrece un mundo en una cuadrícula multi-agente por turnos donde los agentes persiguen objetivos y enfrentan peligros ambientales. Cada agente debe navegar en una cuadrícula ajustable, evitar trampas colocadas aleatoriamente que penalizan o terminan episodios, y recolectar orbes para recompensas positivas. El entorno soporta modos competitivos y cooperativos, permitiendo a investigadores explorar diversos escenarios de aprendizaje. Su API simple se integra perfectamente con bibliotecas RL populares como Stable Baselines o RLlib. Características principales incluyen dimensiones de cuadrícula ajustables, distribuciones dinámicas de trampas y orbes, estructuras de recompensa configurables y registro opcional para análisis del entrenamiento.
Destacados