PommerLearn permite a investigadores y desarrolladores entrenar bots RL multi-agente en el entorno de juego Pommerman. Incluye implementaciones listas para usar de algoritmos populares (PPO, DQN), archivos de configuración flexibles para hiperparámetros, registro automático y visualización de métricas de entrenamiento, guardado de modelos y scripts de evaluación. Su arquitectura modular facilita la extensión con nuevos algoritmos, la personalización de entornos y la integración con bibliotecas ML estándar como PyTorch.
Características principales de PommerLearn
Implementación del algoritmo PPO
Implementación del algoritmo DQN
Envoltorios del entorno Pommerman
Hiperparámetros configurables
Integración de registro y TensorBoard
Control de puntos de control y guardado de modelos