Мощные 強化學習演算法 инструменты

Спонсируется Refly.ai - Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.



Refly.ai - Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.





Новости ИИ

Войти

強化學習演算法

PommerLearn
Объемная RL-рамочная база, предлагающая инструменты обучения и оценки PPO, DQN для разработки сопернических агентов в игре Pommerman.

0


0
Посетить ИИ
Что такое PommerLearn?
PommerLearn позволяет исследователям и разработчикам обучать многоагентных RL-ботов в среде игры Pommerman. Включает готовые реализации популярных алгоритмов (PPO, DQN), гибкие конфигурационные файлы для гиперпараметров, автоматическое логирование и визуализацию метрик обучения, контрольные точки моделей и скрипты оценки. Его модульная архитектура облегчает расширение новыми алгоритмами, настройку среды и интеграцию с стандартными ML-библиотеками, такими как PyTorch.
Основные функции PommerLearn

Реализация алгоритма PPO

Реализация алгоритма DQN

Обертки среды Pommerman

Настраиваемые гиперпараметры

Интеграция логирования и TensorBoard

Контрольные точки и сохранение моделей

Скрипты оценки
MultiAgent-ReinforcementLearning
Open-source фреймворк на Python, реализующий алгоритмы обучения с усилением для многоагентных систем в кооперативных и конкурентных средах.

0


0
Посетить ИИ
Что такое MultiAgent-ReinforcementLearning?
Этот репозиторий предоставляет полный набор алгоритмов обучения с усилением для многоагентных систем, включая MADDPG, DDPG, PPO и другие, интегрированные с стандартными тестовыми средами, такими как Multi-Agent Particle Environment и OpenAI Gym. Он включает настраиваемые оболочки окружений, конфигурируемые скрипты обучения, логирование в реальном времени и метрики оценки производительности. Пользователи могут легко расширять алгоритмы, адаптировать их под собственные задачи и сравнивать политики в условиях сотрудничества и конфликта с минимальной настройкой.
Основные функции MultiAgent-ReinforcementLearning



Рекомендуемые

強化學習演算法

PommerLearn

MultiAgent-ReinforcementLearning