PommerLearn permite a investigadores y desarrolladores entrenar bots RL multi-agente en el entorno de juego Pommerman. Incluye implementaciones listas para usar de algoritmos populares (PPO, DQN), archivos de configuración flexibles para hiperparámetros, registro automático y visualización de métricas de entrenamiento, guardado de modelos y scripts de evaluación. Su arquitectura modular facilita la extensión con nuevos algoritmos, la personalización de entornos y la integración con bibliotecas ML estándar como PyTorch.
Características principales de PommerLearn
Implementación del algoritmo PPO
Implementación del algoritmo DQN
Envoltorios del entorno Pommerman
Hiperparámetros configurables
Integración de registro y TensorBoard
Control de puntos de control y guardado de modelos
Este repositorio proporciona una suite completa de algoritmos de aprendizaje por refuerzo multiagente, incluyendo MADDPG, DDPG, PPO y más, integrados con benchmarks estándar como el Entorno de Partículas Multi-Agente y OpenAI Gym. Incluye wrappers de entornos personalizables, scripts de entrenamiento configurables, registro en tiempo real y métricas de evaluación del rendimiento. Los usuarios pueden ampliar fácilmente los algoritmos, adaptarlos a tareas personalizadas y comparar políticas en entornos cooperativos y adversarios con mínima configuración.
Características principales de MultiAgent-ReinforcementLearning