Мощные Глубокая Q-сеть инструменты

Спонсируется Elser AI - Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.



Elser AI - Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.





Новости ИИ

Войти

Глубокая Q-сеть

Dino Reinforcement Learning
Рамки для обучения с подкреплением на базе Python, реализующие deep Q-learning для обучения AI-агента игре офлайн-динозавра Chrome.

0


0
Посетить ИИ
Что такое Dino Reinforcement Learning?
Dino Reinforcement Learning — это полный набор инструментов для обучения AI-агента играть в игру динозавров Chrome с помощью обучения с подкреплением. Интеграция с безголовым Chrome через Selenium обеспечивает захват игровых кадров в реальном времени и их обработку в представления состояний, оптимизированные для входных данных глубоких Q-сетей. В рамках реализованы модули памяти воспроизведения, эвристического исследования epsilon-greedy, моделей сверточных нейронных сетей и циклов обучения с настраиваемыми гиперпараметрами. Пользователи могут отслеживать прогресс обучения через консольные логи и сохранять контрольные точки для последующей оценки. После обучения агент может быть запущен для автономной игры или протестирован против различных архитектур моделей. Модульный дизайн облегчает замену алгоритмов RL, что делает платформу гибкой для экспериментов.
Основные функции Dino Reinforcement Learning

Обертка для среды игры Chrome Dino через Selenium

Реализация глубокого Q-сети с предварительной обработкой CNN

Мемория воспроизведения и исследование epsilon-greedy

Настраиваемые циклы обучения и гиперпараметры

Сохранение контрольных точек и логирование производительности
DQN-Deep-Q-Network-Atari-Breakout-TensorFlow
Открытое исходное TensorFlow-основанный агент Deep Q-Network, обучающийся играть в Atari Breakout с использованием воспроизведения опыта и целевых сетей.

0


0
Посетить ИИ
Что такое DQN-Deep-Q-Network-Atari-Breakout-TensorFlow?
DQN-Deep-Q-Network-Atari-Breakout-TensorFlow обеспечивает полную реализацию алгоритма DQN, адаптированную для среды Atari Breakout. Использует сверточную нейронную сеть для приближения Q-значений, применяет воспроизведение опыта для разрыва корреляций между последовательными наблюдениями и используют периодически обновляемую целевую сеть для стабилизации обучения. Агент действует по epsilon-greedy политике для исследования и может обучаться с нуля на необработанных пиксельных входных данных. В репозитории есть файлы конфигурации, скрипты обучения для мониторинга роста наград, тестовые скрипты для проверки обученных моделей и утилиты TensorBoard для визуализации метрик обучения. Пользователи могут настраивать гиперпараметры, такие как скорость обучения, размер буфера воспроизведения и размер пакета, для экспериментирования с разными настройками.
Основные функции DQN-Deep-Q-Network-Atari-Breakout-TensorFlow



Рекомендуемые

Глубокая Q-сеть

Dino Reinforcement Learning

DQN-Deep-Q-Network-Atari-Breakout-TensorFlow