MADDPG実装

MultiAgentSystems
Открытая платформа на Python, позволяющая проектировать, обучать и оценивать системы многоагентного обучения с подкреплением, как кооперативные, так и конкурентные.

0


0
Посетить ИИ
Что такое MultiAgentSystems?
MultiAgentSystems предназначена для упрощения процесса создания и оценки приложений многоагентного обучения с подкреплением (MARL). Платформа включает реализации современных алгоритмов, таких как MADDPG, QMIX, VDN, а также централизованное обучение с децентрализованным исполнением. В ней реализованы модульные обертки для сред OpenAI Gym, протоколы коммуникации между агентами и утилиты для журналирования метрик, таких как награда и сходимость. Исследователи могут настраивать архитектуры агентов, гиперпараметры, моделировать сценарии, включая совместную навигацию, распределение ресурсов и противоборствующие игры. Благодаря встроенной поддержке PyTorch, ускорению на GPU и интеграции с TensorBoard, MultiAgentSystems ускоряет эксперименты и бенчмаркинг в области коллаборативного и соревновательного многоагентного обучения.
Основные функции MultiAgentSystems

Реализации MADDPG, QMIX, VDN и других алгоритмов

Модульные обертки среды для OpenAI Gym

Модули коммуникации и координации агентов

Интеграция логирования и TensorBoard

GPU-ускорение с PyTorch
AutoDRIVE Cooperative MARL
Открытая платформа, реализующая кооперативное обучение с подкреплением для мультияпонных агентов при автономном управлении в симуляции.

0


0
Посетить ИИ
Что такое AutoDRIVE Cooperative MARL?
AutoDRIVE Cooperative MARL — это проект на GitHub, сочетающий симулятор городского вождения AutoDRIVE с адаптируемыми алгоритмами мультиагентного обучения с подкреплением. Включает скрипты обучения, оболочки среды, метрики оценки и инструменты визуализации для разработки и тестирования политик кооперативного вождения. Пользователи могут настраивать наблюдаемые пространства агентов, функции вознаграждения и гиперпараметры обучения. Репозиторий поддерживает модульные расширения, позволяющие определять индивидуальные задачи, использовать обучение по куррикулуму и отслеживать показатели эффективности для исследований по координации автономных транспортных средств.
Основные функции AutoDRIVE Cooperative MARL