- Modules de réseau de prédiction pour la prévision des actions des pairs
- Allocation dynamique des récompenses à travers plusieurs agents
- Wrappeurs d'environnement pour des benchmarks coopératifs courants
- Pipelines d'entraînement configurables et hyperparamètres
- Enregistrement et visualisation des métriques de performance