- Creación de entornos multiagente personalizables
- Algoritmos RL pre-implementados (DQN, PPO, MADDPG)
- Modos de entrenamiento sincrónico y asincrónico
- Comunicación entre agentes y módulos de paso de mensajes
- Registro de experimentos e integración con TensorBoard
- Scripts de visualización y notebooks integrados