Этот репозиторий предоставляет полный набор алгоритмов обучения с усилением для многоагентных систем, включая MADDPG, DDPG, PPO и другие, интегрированные с стандартными тестовыми средами, такими как Multi-Agent Particle Environment и OpenAI Gym. Он включает настраиваемые оболочки окружений, конфигурируемые скрипты обучения, логирование в реальном времени и метрики оценки производительности. Пользователи могут легко расширять алгоритмы, адаптировать их под собственные задачи и сравнивать политики в условиях сотрудничества и конфликта с минимальной настройкой.