Эффективные configuração do ambiente решения

Используйте configuração do ambiente инструменты с высокой производительностью для успешной работы.

configuração do ambiente

  • Open-source рамочная платформа с несколькими агентами с обучением с подкреплением для кооперативного управления автономными транспортными средствами в дорожных сценариях.
    0
    0
    Что такое AutoDRIVE Cooperative MARL?
    AutoDRIVE Cooperative MARL — это открытая платформа для обучения и развертывания совместных политик обучения с подкреплением для автономных заданий. Она интегрируется с реалистичными симуляторами для моделирования дорожных сценариев, таких как перекрестки, автопоезда на шоссе и сценарии слияния. В рамках реализовано централизованное обучение с децентрализованным выполнением, что позволяет транспортным средствам обучаться объединённым политикам для повышения эффективности и безопасности дорожного движения. Пользователи могут настраивать параметры среды, выбирать алгоритмы MARL, визуализировать прогресс обучения и оценивать координацию агентов.
    Основные функции AutoDRIVE Cooperative MARL
    • Централизованное обучение с децентрализованным выполнением
    • Кооперативные алгоритмы обучения с подкреплением для нескольких агентов
    • Настраиваемые дорожные сценарии
    • Интеграция с симулятором и визуализация
    • Инструменты для оценки производительности
  • Многопользовательская среда обучения с подкреплением на основе Python для совместного поиска с настраиваемой коммуникацией и вознаграждениями.
    0
    0
    Что такое Cooperative Search Environment?
    Среда совместного поиска обеспечивает гибкую, совместимую с gym многопользовательскую среду обучения с подкреплением, предназначенную для задач совместного поиска как на дискретных сетках, так и в непрерывных пространствах. Агентов можно управлять при частичном наблюдении и обмениваться информацией в соответствии с настраиваемыми топологиями связи. Фреймворк поддерживает предопределенные сценарии, такие как поиск и спасение, отслеживание целей в динамике и совместное картографирование, предлагает API для определения пользовательских сценариев и структур наград. Интегрируется с популярными RL-библиотеками, такими как Stable Baselines3 и Ray RLlib, включает средства журналирования для анализа производительности и встроенные инструменты визуализации для мониторинга в реальном времени. Исследователи могут изменять размеры сеток, число агентов, диапазон сенсоров и механизмы обмена наградами для оценки стратегий координации и эффективной проверки новых алгоритмов.
Рекомендуемые