Эффективные 代理導航 решения

Используйте 代理導航 инструменты с высокой производительностью для успешной работы.

代理導航

  • RL Shooter обеспечивает настраиваемую среду обучения с укрепленным обучением на базе Doom, которая позволяет обучать ИИ-агентов навигации и стрельбы по мишеням.
    0
    0
    Что такое RL Shooter?
    RL Shooter — это фреймворк на Python, который интегрирует ViZDoom с API OpenAI Gym для создания гибкой среды обучения с укрепленным обучением для игр FPS. Пользователи могут определять пользовательские сценарии, карты и структуры вознаграждений для обучения агентов навигации, обнаружения целей и стрельбы. Благодаря настраиваемым кадрам наблюдения, пространствам действий и системам логирования, он поддерживает популярные библиотеки глубокого обучения с укрепленным обучением, такие как Stable Baselines и RLlib, обеспечивая отслеживание производительности и воспроизводимость экспериментов.
    Основные функции RL Shooter
    • Настраиваемые сценарии FPS на базе ViZDoom
    • Потоки визуальных кадров наблюдения
    • Настраиваемые функции вознаграждения
    • Настраиваемые определения пространства действий
    • Совместимость с API OpenAI Gym
    • Пропуск кадров и контроль FPS
    • Поддержка логгирования и TensorBoard
  • Фреймворк на PyTorch, позволяющий агентам обучать появляющиеся протоколы коммуникации в задачах мног Agents reinforcement learning.
    0
    0
    Что такое Learning-to-Communicate-PyTorch?
    Данное репозитории реализует появляющуюся коммуникацию в задачах обучения с подкреплением для нескольких агентов с помощью PyTorch. Пользователи могут настроить нейронные сети для отправителей и получателей для игры в референциальные игры или совместную навигацию, побуждая агентов развивать дискретный или непрерывный канал связи. Включены скрипты для обучения, оценки и визуализации изученных протоколов, а также утилиты для создания окружений, кодирования и декодирования сообщений. Исследователи могут расширять их пользовательскими задачами, изменять архитектуру сетей и анализировать эффективность протоколов, что способствует быстрому экспериментированию в области появления коммуникации агентов.
Рекомендуемые