- Обучение политики на базе PPO в среде SC2
- Интеграция с PySC2 от DeepMind для обработки состояний и действий
- Настраиваемые архитектуры нейронных сетей и вознаграждения
- Поддержка многопроцессорной обработки для параллельного сбора образцов
- Логирование и интеграция с TensorBoard
- Скрипты для оценки и сравнения агентов