Мощные реализация DQN инструменты

Спонсируется FineVoice - Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.



FineVoice - Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.





Новости ИИ

Войти

реализация DQN

RL-Agents
Открытая библиотека PyTorch, обеспечивающая модульные реализации агентов обучения с подкреплением, таких как DQN, PPO, SAC и другие.

0


0
Посетить ИИ
Что такое RL-Agents?
RL-Agents — это научный уровень фреймворка обучения с подкреплением, построенного на PyTorch, объединяющего популярные RL-алгоритмы из методов, основанных на ценности, политике и акторе-критике. Библиотека включает модульный API агентов, GPU-ускорение, бесшовную интеграцию с OpenAI Gym и встроенные инструменты логирования и визуализации. Пользователи могут настраивать гиперпараметры, адаптировать циклы обучения и тестировать производительность с помощью нескольких строк кода, что делает RL-Agents идеальным выбором для академических исследований, прототипирования и промышленного эксперимента.
Основные функции RL-Agents

Реализации DQN, DDQN, PPO, A2C, SAC, TD3

Модульный, расширяемый API агентов

GPU-ускорение через PyTorch

Интеграция с окружениями OpenAI Gym

Встроенная поддержка логирования и визуализации
YGO-Agent
Открытый агент RL для дуэлей Yu-Gi-Oh, предоставляющий моделирование среды, обучение политики и оптимизацию стратегии.

0


0
Посетить ИИ
Что такое YGO-Agent?
Фреймворк YGO-Agent позволяет исследователям и энтузиастам создавать ИИ-ботов, которые играют в Yu-Gi-Oh, используя обучение с подкреплением. Он оборачивает симулятор YGOPRO в совместимую с OpenAI Gym среду, определяя состояния, такие как рука, поле и показатели жизни, а также действия, включая призыв, активацию заклинаний/ловушек и атаки. Вознаграждения основаны на исходе победы/проигрыша, нанесённом уроне и ходе игры. Архитектура агента реализована на PyTorch с использованием DQN, с возможностью настройки кастомных сетевых архитектур, повторной обучения опыта и ε-жадной стратегии исследования. Модули логирования регистрируют кривые обучения, коэффициенты выигрыша и подробные логовые записи ходов для анализа. Рамочное решение модульное, что позволяет пользователям заменять или расширять компоненты, такие как функции награды или пространство действий.
Основные функции YGO-Agent



Рекомендуемые

реализация DQN

RL-Agents

YGO-Agent