suivi d'expériences

MultiAgentModel
Python-фреймворк, позволяющий проектировать, моделировать и обучать с помощью обучения с укреплением кооперативные многопользовательские системы.

0


0
Посетить ИИ
Что такое MultiAgentModel?
MultiAgentModel предоставляет единый API для определения пользовательских окружений и классов агентов для сценариев с множеством агентов. Разработчики могут задавать пространства наблюдения и действий, структуры награды и каналы связи. Встроенная поддержка популярных RL-алгоритмов, таких как PPO, DQN и A2C, позволяет тренировать модели с минимальной настройкой. Инструменты визуализации в реальном времени помогают отслеживать взаимодействия агентов и показатели их эффективности. Модульная архитектура обеспечивает легкую интеграцию новых алгоритмов и пользовательских модулей. Также включает гибкую систему конфигурации для настройки гиперпараметров, утилиты логирования для отслеживания экспериментов и совместимость с OpenAI Gym для бесшовной портативности. Пользователи могут совместно работать над общими окружениями и воспроизводить зафиксированные сессии для анализа.
Основные функции MultiAgentModel

Модульные определения окружений и агентов

Поддержка алгоритмов PPO, DQN, A2C

Настраиваемые функции награды и коммуникации

Реальное время визуализации взаимодействий агентов

Конфигурация гиперпараметров и утилиты логирования

Совместимость с OpenAI Gym
MADDPG-Keras
Реализация Multi-Agent Deep Deterministic Policy Gradient на базе Keras для кооперативного и соревновательного многопроAgentного обучения с подкреплением.

0


0
Посетить ИИ
Что такое MADDPG-Keras?
MADDPG-Keras обеспечивает полный каркас для исследований в области обучения с подкреплением с несколькими агентами, реализуя алгоритм MADDPG в Keras. Поддерживаются непрерывные пространства действий, несколько агентов и стандартные среды OpenAI Gym. Исследователи и разработчики могут настраивать архитектуры нейронных сетей, гиперпараметры обучения и функции вознаграждения, после чего запускать эксперименты с встроенным логированием и контрольными точками для ускорения обучения политик и оценки производительности.
Основные функции MADDPG-Keras