- Estructura de entorno multiagente
- Definiciones modulares de agentes y políticas
- Mecanismos personalizables de compartición de recompensas
- Algoritmos RL incorporados (DQN, PPO, A3C)
- Plantillas de escenario y configuraciones dinámicas
- Gestión del ciclo de entrenamiento y callbacks
- Registro de rendimiento y visualización