Mean-Field MARL предоставляет надежный фреймворк на Python для реализации и оценки алгоритмов обучения с подкреплением для нескольких агентов с помощью среднего поля. Он моделирует взаимодействия больших агентов, аппроксимируя средний эффект соседних агентов через Q-обучение с использованием среднего поля. В библиотеку входят обертки сред, модули политик агентов, циклы обучения и метрики оценки, что позволяет масштабировать обучение сотен агентов. Созданный на базе PyTorch для ускорения на GPU, он поддерживает настраиваемые среды, такие как Particle World и Gridworld. Модульный дизайн облегчает расширение новыми алгоритмами, а встроенные инструменты логирования и визуализации на базе Matplotlib позволяют отслеживать награды, кривые потерь и распределения среднего поля. Примерные скрипты и документация помогают пользователям настроить, конфигурировать эксперименты и анализировать результаты, делая его идеальным как для исследований, так и для прототипирования больших систем агентов.