Este repositório fornece um conjunto completo de algoritmos de aprendizado por reforço multiagente—incluindo MADDPG, DDPG, PPO e outros—integrados com benchmarks padrão como o Multi-Agent Particle Environment e OpenAI Gym. Possui wrappers de ambiente personalizáveis, scripts de treinamento configuráveis, registro de logs em tempo real e métricas de avaliação de desempenho. Os usuários podem facilmente estender algoritmos, adaptar para tarefas personalizadas e comparar políticas em configurações cooperativas e adversariais com configuração mínima.