- Implementaciones preconstruidas de agentes (DQN, PPO, SAC, etc.)
- Buffers de repetición modulares y envoltorios de entornos
- Bucle de entrenamiento y planificadores configurables
- Motor de ejecución distribuida para entrenamiento escalable
- Utilidades integradas de registro y evaluación
- Compatibilidad con TensorFlow y JAX
- Guardar y seguir métricas