Эффективные 協調学習 решения

Используйте 協調学習 инструменты с высокой производительностью для успешной работы.

協調学習

  • MARL-DPP реализует многоагентное обучение с подкреплением с диверсификацией посредством детерминантных точечных процессов (DPP) для поощрения разнообразных скоординированных политик.
    0
    0
    Что такое MARL-DPP?
    MARL-DPP — это открытый исходный код, позволяющий организовать многоагентное обучение с подкреплением (MARL) с принудительным разнообразием через детерминантные точечные процессы (DPP). Традиционные подходы MARL часто сталкиваются с сходимостью политик к похожему поведению; MARL-DPP решает эту проблему, внедряя меры на базе DPP, чтобы поощрять агентов сохранять разнообразное распределение действий. Набор инструментов предоставляет модульный код для включения DPP в цели обучения, выбор политик и управление исследованием. В комплект входит готовое интегрирование с стандартными средами OpenAI Gym и Multi-Agent Particle Environment (MPE), а также утилиты для управления гиперпараметрами, журналирования и визуализации метрик разнообразия. Исследователи могут оценить влияние ограничений на разнообразие на кооперативные задачи, ресурсо-распределение и соревновательные игры. Расширяемый дизайн поддерживает пользовательские среды и продвинутые алгоритмы, способствуя исследованию новых вариантов MARL-DPP.
    Основные функции MARL-DPP
    • Модуль диверсификации на базе DPP
    • Интеграция с OpenAI Gym
    • Поддержка сред MPE
    • Скрипты обучения и оценки
    • Визуализация метрик диверсификации
  • Открытая платформа с несколькими агентами для обучения с подкреплением, позволяющая управлять агентами на уровне команды и взаимодействовать в StarCraft II через PySC2.
    0
    0
    Что такое MultiAgent-Systems-StarCraft2-PySC2-Raw?
    MultiAgent-Systems-StarCraft2-PySC2-Raw предоставляет полный инструментарий для разработки, обучения и оценки нескольких AI-агентов в StarCraft II. Он обеспечивает низкоуровневое управление движением юнитов, целью и способностями, а также гибкую настройку наград и сценариев. Пользователи могут легко интегрировать собственные архитектуры нейронных сетей, определять стратегии командного взаимодействия и записывать метрики. Основанный на PySC2, он поддерживает параллельное обучение, создание снимков и визуализацию, что делает его идеальным для исследований в области обучения с подкреплением с несколькими агентами.
Рекомендуемые