Эффективные 強化學習基準 решения

Используйте 強化學習基準 инструменты с высокой производительностью для успешной работы.

強化學習基準

  • Open-source фреймворк на Python, реализующий алгоритмы обучения с усилением для многоагентных систем в кооперативных и конкурентных средах.
    0
    0
    Что такое MultiAgent-ReinforcementLearning?
    Этот репозиторий предоставляет полный набор алгоритмов обучения с усилением для многоагентных систем, включая MADDPG, DDPG, PPO и другие, интегрированные с стандартными тестовыми средами, такими как Multi-Agent Particle Environment и OpenAI Gym. Он включает настраиваемые оболочки окружений, конфигурируемые скрипты обучения, логирование в реальном времени и метрики оценки производительности. Пользователи могут легко расширять алгоритмы, адаптировать их под собственные задачи и сравнивать политики в условиях сотрудничества и конфликта с минимальной настройкой.
    Основные функции MultiAgent-ReinforcementLearning
    • Реализации MADDPG, DDPG, PPO
    • Оболочки окружений для Multi-Agent Particle и Gym
    • Настраиваемые скрипты обучения и оценки
    • Логирование в реальном времени с TensorBoard
    • Модульная структура для расширения
  • RxAgent-Zoo использует реактивное программирование с RxPY для упрощения разработки и экспериментов с модульными агентами усиленного обучения.
    0
    0
    Что такое RxAgent-Zoo?
    В основе RxAgent-Zoo лежит реактивная RL-структура, которая рассматривает события данных из окружающей среды, буферы повторного воспроизведения и циклы обучения как наблюдаемые потоки. Пользователи могут цепочками операторов предобрабатывать наблюдения, обновлять сети и асинхронно регистрировать метрики. Библиотека поддерживает параллельную работу с окружающими средами, настраиваемые планировщики и интеграцию с популярными бенчмарками Gym и Atari. API "подключи и используй" позволяет бесшовно заменять компоненты агента, что способствует воспроизводимости, быстрому экспериментированию и масштабируемым рабочим потокам обучения.
Рекомендуемые