Эффективные 可配置環境 решения

Используйте 可配置環境 инструменты с высокой производительностью для успешной работы.

可配置環境

  • Объемная RL-рамочная база, предлагающая инструменты обучения и оценки PPO, DQN для разработки сопернических агентов в игре Pommerman.
    0
    0
    Что такое PommerLearn?
    PommerLearn позволяет исследователям и разработчикам обучать многоагентных RL-ботов в среде игры Pommerman. Включает готовые реализации популярных алгоритмов (PPO, DQN), гибкие конфигурационные файлы для гиперпараметров, автоматическое логирование и визуализацию метрик обучения, контрольные точки моделей и скрипты оценки. Его модульная архитектура облегчает расширение новыми алгоритмами, настройку среды и интеграцию с стандартными ML-библиотеками, такими как PyTorch.
    Основные функции PommerLearn
    • Реализация алгоритма PPO
    • Реализация алгоритма DQN
    • Обертки среды Pommerman
    • Настраиваемые гиперпараметры
    • Интеграция логирования и TensorBoard
    • Контрольные точки и сохранение моделей
    • Скрипты оценки
  • Pits and Orbs предоставляет многопользовательскую среду на клетчатом поле, где ИИ-агенты избегают ловушек, собирают сферы и соревнуются в пошаговых сценариях.
    0
    0
    Что такое Pits and Orbs?
    Pits and Orbs — это открытая среда для обучения с усилением, реализованная на Python, предлагающая пошаговый многопользовательский мир с клетчатой сеткой, в которой агенты преследуют цели и сталкиваются с опасностями окружающей среды. Каждый агент должен перемещаться по настраиваемой сетке, избегать случайных ловушек, которые штрафуют или завершают эпизоды, и собирать сферы для положительных наград. Среда поддерживает как соревновательные, так и кооперативные режимы, позволяя исследовать различные сценарии обучения. Простая API легко интегрируется с популярными RL-библиотеками, такими как Stable Baselines и RLlib. Основные возможности включают регулируемые размеры сетки, динамическое распределение ловушек и сфер, настраиваемые структуры наград и опциональный логинг для анализа тренировки.
Рекомендуемые