

Эффективные 하이퍼파라미터 튜닝 решения

Используйте 하이퍼파라미터 튜닝 инструменты с высокой производительностью для успешной работы.

하이퍼파라미터 튜닝

DQN-Deep-Q-Network-Atari-Breakout-TensorFlow
Открытое исходное TensorFlow-основанный агент Deep Q-Network, обучающийся играть в Atari Breakout с использованием воспроизведения опыта и целевых сетей.

0


0
Посетить ИИ
Что такое DQN-Deep-Q-Network-Atari-Breakout-TensorFlow?
DQN-Deep-Q-Network-Atari-Breakout-TensorFlow обеспечивает полную реализацию алгоритма DQN, адаптированную для среды Atari Breakout. Использует сверточную нейронную сеть для приближения Q-значений, применяет воспроизведение опыта для разрыва корреляций между последовательными наблюдениями и используют периодически обновляемую целевую сеть для стабилизации обучения. Агент действует по epsilon-greedy политике для исследования и может обучаться с нуля на необработанных пиксельных входных данных. В репозитории есть файлы конфигурации, скрипты обучения для мониторинга роста наград, тестовые скрипты для проверки обученных моделей и утилиты TensorBoard для визуализации метрик обучения. Пользователи могут настраивать гиперпараметры, такие как скорость обучения, размер буфера воспроизведения и размер пакета, для экспериментирования с разными настройками.
Основные функции DQN-Deep-Q-Network-Atari-Breakout-TensorFlow

Реализация Deep Q-Network

Буфер воспроизведения опыта

Обновление целевой сети

Исследование epsilon-greedy

Визуализация в TensorBoard
MultiAgentSystems
Открытая платформа на Python, позволяющая проектировать, обучать и оценивать системы многоагентного обучения с подкреплением, как кооперативные, так и конкурентные.

0


0
Посетить ИИ
Что такое MultiAgentSystems?
MultiAgentSystems предназначена для упрощения процесса создания и оценки приложений многоагентного обучения с подкреплением (MARL). Платформа включает реализации современных алгоритмов, таких как MADDPG, QMIX, VDN, а также централизованное обучение с децентрализованным исполнением. В ней реализованы модульные обертки для сред OpenAI Gym, протоколы коммуникации между агентами и утилиты для журналирования метрик, таких как награда и сходимость. Исследователи могут настраивать архитектуры агентов, гиперпараметры, моделировать сценарии, включая совместную навигацию, распределение ресурсов и противоборствующие игры. Благодаря встроенной поддержке PyTorch, ускорению на GPU и интеграции с TensorBoard, MultiAgentSystems ускоряет эксперименты и бенчмаркинг в области коллаборативного и соревновательного многоагентного обучения.
Основные функции MultiAgentSystems



Рекомендуемые

Эффективные 하이퍼파라미터 튜닝 решения

Используйте 하이퍼파라미터 튜닝 инструменты с высокой производительностью для успешной работы.

하이퍼파라미터 튜닝

DQN-Deep-Q-Network-Atari-Breakout-TensorFlow

MultiAgentSystems