Эффективные modulare Codebasis решения

Используйте modulare Codebasis инструменты с высокой производительностью для успешной работы.

modulare Codebasis

  • Упрощенная реализация AlphaStar на PyTorch, позволяющая обучать агента RL для StarCraft II с модульной архитектурой сети и самостоятельной игрой.
    0
    0
    Что такое mini-AlphaStar?
    mini-AlphaStar демистифицирует сложную архитектуру AlphaStar, предлагая доступную и с открытым исходным кодом платформу на PyTorch для разработки ИИ для StarCraft II. Включает пространственные кодеры признаков для входных данных экрана и миникарты, обработку не пространственных признаков, модули памяти LSTM, отдельные сети политики и оценки стоимости для выбора действий и оценки состояния. Используя обучение имитацией для начальной настройки и обучение с усилением с помощью самоигры для донастройки, он поддерживает совместимые с pysc2 обертки окружения, логирование через TensorBoard и настраиваемые гиперпараметры. Исследователи и студенты могут создавать наборы данных из игровых состояний человека, обучать модели на пользовательских сценариях, оценивать эффективность агента и визуализировать кривые обучения. Модульный код облегчает эксперименты с вариациями сети, графиками обучения и многопро Agent-и. Предназначен для образовательных целей и прототипирования, а не для промышленного использования.
  • Открытая фреймворк на базе PyTorch, реализующий архитектуру CommNet для многопользовательского обучения с подкреплением с межагентской коммуникацией, что позволяет совместное принятие решений.
    0
    0
    Что такое CommNet?
    CommNet — это библиотека ориентированная на исследования, реализующая архитектуру CommNet, позволяющую нескольким агентам делиться скрытыми состояниями на каждом шаге времени и обучаться координировать действия в кооперативных средах. Включает определения моделей PyTorch, скрипты обучения и оценки, оболочки среды для OpenAI Gym и утилиты для настройки каналов связи, количества агентов и глубины сети. Исследователи и разработчики могут использовать CommNet для прототипирования и бенчмаркинга стратегий межагентской коммуникации в задачах навигации, преследования–уклонения и сбора ресурсов.
Рекомендуемые