Open-source симулятор мультиагентного обучения с подкреплением, обеспечивающий масштабируемое параллельное обучение, настраиваемые среды и протоколы взаимодействия агентов.
MARL Simulator предназначен для эффективной и масштабируемой разработки алгоритмов мультиагентного обучения с подкреплением (MARL). Используя распределённое ядро PyTorch, он позволяет запускать параллельное обучение на нескольких GPU или узлах, значительно сокращая время экспериментов. Модульный интерфейс окружений поддерживает стандартные сценарии — такие как совместная навигация, охотник-жертва и мир в сетке, — а также пользовательские среды. Агентам доступны различные протоколы коммуникации для координации действий, обмена наблюдениями и синхронизации наград. Настраиваемые пространства наград и наблюдений обеспечивают тонкий контроль за динамикой обучения, а встроенные инструменты логирования и визуализации дают постоянный обзор показателей эффективности.
Основные функции MARL Simulator
Распределённое мультиагентное обучение через PyTorch
Модульный интерфейс окружений
Настраиваемые пространства наград и наблюдений
Протоколы коммуникации агентов
Стандартные сценарии (мир в сетке, охотник-жертва)