- Многоагентский каркас окружений
- Модульные определения агентов и политик
- Настраиваемые механизмы обмена вознаграждениями
- Встроенные алгоритмы RL (DQN, PPO, A3C)
- Шаблоны сценариев и динамические конфигурации
- Управление циклом обучения и коллбэками
- Логирование эффективности и визуализация