- Étape 1 : Cloner le dépôt WorFBench depuis GitHub
- Étape 2 : Installer les dépendances via pip ou conda
- Étape 3 : Configurer les clés API et points de terminaison dans config.yaml
- Étape 4 : Sélectionner ou définir des tâches de référence dans le dossier des tâches
- Étape 5 : Exécuter les scripts d’évaluation pour tester les agents contre les tâches
- Étape 6 : Utiliser les outils de visualisation pour analyser les résultats
- Étape 7 : Étendre ou personnaliser les tâches et métriques pour de nouvelles expérimentations