- Реализации предварительно созданных агентов (DQN, PPO, SAC и др.)
- Модульные буферы повторов и оболочки для среды
- Настраиваемые циклы обучения и планировщики
- Движок распределённого выполнения для масштабируемого обучения
- Интегрированное логирование и утилиты оценки
- Совместимость с TensorFlow и JAX
- Сохранение и отслеживание метрик