

Эффективные 실험의 재현성 решения

Используйте 실험의 재현성 инструменты с высокой производительностью для успешной работы.

실험의 재현성

RL Shooter
RL Shooter обеспечивает настраиваемую среду обучения с укрепленным обучением на базе Doom, которая позволяет обучать ИИ-агентов навигации и стрельбы по мишеням.

0


0
Посетить ИИ
Что такое RL Shooter?
RL Shooter — это фреймворк на Python, который интегрирует ViZDoom с API OpenAI Gym для создания гибкой среды обучения с укрепленным обучением для игр FPS. Пользователи могут определять пользовательские сценарии, карты и структуры вознаграждений для обучения агентов навигации, обнаружения целей и стрельбы. Благодаря настраиваемым кадрам наблюдения, пространствам действий и системам логирования, он поддерживает популярные библиотеки глубокого обучения с укрепленным обучением, такие как Stable Baselines и RLlib, обеспечивая отслеживание производительности и воспроизводимость экспериментов.
Основные функции RL Shooter

Настраиваемые сценарии FPS на базе ViZDoom

Потоки визуальных кадров наблюдения

Настраиваемые функции вознаграждения

Настраиваемые определения пространства действий

Совместимость с API OpenAI Gym

Пропуск кадров и контроль FPS

Поддержка логгирования и TensorBoard
Mean-Field MARL
Open-source библиотека Python, реализующая методы обучения с подкреплением для нескольких агентов с использованием среднего поля для масштабируемого обучения в больших системах агентов.

0


0
Посетить ИИ
Что такое Mean-Field MARL?
Mean-Field MARL предоставляет надежный фреймворк на Python для реализации и оценки алгоритмов обучения с подкреплением для нескольких агентов с помощью среднего поля. Он моделирует взаимодействия больших агентов, аппроксимируя средний эффект соседних агентов через Q-обучение с использованием среднего поля. В библиотеку входят обертки сред, модули политик агентов, циклы обучения и метрики оценки, что позволяет масштабировать обучение сотен агентов. Созданный на базе PyTorch для ускорения на GPU, он поддерживает настраиваемые среды, такие как Particle World и Gridworld. Модульный дизайн облегчает расширение новыми алгоритмами, а встроенные инструменты логирования и визуализации на базе Matplotlib позволяют отслеживать награды, кривые потерь и распределения среднего поля. Примерные скрипты и документация помогают пользователям настроить, конфигурировать эксперименты и анализировать результаты, делая его идеальным как для исследований, так и для прототипирования больших систем агентов.
Основные функции Mean-Field MARL



Рекомендуемые

Эффективные 실험의 재현성 решения

Используйте 실험의 재현성 инструменты с высокой производительностью для успешной работы.

실험의 재현성

RL Shooter

Mean-Field MARL