

Эффективные カスタマイズ可能な報酬関数 решения

Используйте カスタマイズ可能な報酬関数 инструменты с высокой производительностью для успешной работы.

カスタマイズ可能な報酬関数

MAPF_G2RL
MAPF_G2RL — это фреймворк на Python для обучения агентов глубокого усиленного обучения для эффективного поиска путей среди нескольких агентов на графах.

0


0
Посетить ИИ
Что такое MAPF_G2RL?
MAPF_G2RL — это открытая исследовательская среда, соединяющая теорию графов и глубокое усиленное обучение для решения задачи поиска путей с несколькими агентами (MAPF). Она кодирует узлы и ребра в векторные представления, определяет пространственные и коллизионно-осведомленные функции награды, поддерживает различные алгоритмы RL, такие как DQN, PPO и A2C. Фреймворк автоматизирует создание сценариев, генерируя случайные графы или импортируя карты реального мира, а также управляет циклами обучения, оптимизирующими политики для нескольких агентов одновременно. После обучения агенты оцениваются в симуляционных средах по показателям оптимальности маршрутов, времени выполнения и уровню успеха. Его модульный дизайн позволяет исследователям расширять ключевые компоненты, интегрировать новые методы MARL и проводить сравнение с классическими решателями.
Основные функции MAPF_G2RL

Кодирование графов и их предобработка

Настраиваемые модули формирования наград

Поддержка алгоритмов DQN, PPO, A2C

Генератор сценариев для случайных и реальных карт

Многопроцессное обучение и оценка агентов

Инструменты логирования и визуализации
gym-fx
gym-fx предоставляет настраиваемую среду OpenAI Gym для тренировки и оценки агентов обучения с подкреплением для стратегий торговли на Форекс.

0


0
Посетить ИИ
Что такое gym-fx?
gym-fx — это библиотека с открытым исходным кодом на Python, реализующая имитированную среду торговли на Форекс с использованием интерфейса OpenAI Gym. Она поддерживает несколько валютных пар, интегрирует исторические ценовые данные, технические индикаторы и полностью настраиваемые функции награды. Предоставляя стандартизированный API, gym-fx упрощает проведение бенчмаркинга и разработки алгоритмов обучения с подкреплением для алгоритмической торговли. Пользователи могут настраивать проскальзывание на рынке, транзакционные издержки и пространства для наблюдений, чтобы максимально точно моделировать реальные торговые сценарии, что способствует разработке и оценке устойчивых стратегий.
Основные функции gym-fx



Рекомендуемые

Эффективные カスタマイズ可能な報酬関数 решения

Используйте カスタマイズ可能な報酬関数 инструменты с высокой производительностью для успешной работы.

カスタマイズ可能な報酬関数

MAPF_G2RL

gym-fx