PommerLearn permite que pesquisadores e desenvolvedores treinem bots de RL multiagentes no ambiente de jogo Pommerman. Inclui implementações prontas de algoritmos populares (PPO, DQN), arquivos de configuração flexíveis para hiperparâmetros, registro e visualização automáticos de métricas de treinamento, ponto de verificação de modelos e scripts de avaliação. Sua arquitetura modular facilita a extensão com novos algoritmos, customização de ambientes e integração com bibliotecas padrão de ML como PyTorch.
Este repositório fornece um conjunto completo de algoritmos de aprendizado por reforço multiagente—incluindo MADDPG, DDPG, PPO e outros—integrados com benchmarks padrão como o Multi-Agent Particle Environment e OpenAI Gym. Possui wrappers de ambiente personalizáveis, scripts de treinamento configuráveis, registro de logs em tempo real e métricas de avaliação de desempenho. Os usuários podem facilmente estender algoritmos, adaptar para tarefas personalizadas e comparar políticas em configurações cooperativas e adversariais com configuração mínima.
Recursos Principais do MultiAgent-ReinforcementLearning