- Tâches de référence variées basées sur des workflows
- Métriques d’évaluation standardisées
- Interface modulaire pour les agents LLM
- Implémentations de référence d’agents
- Support de l’orchestration multi-outils
- Tableaux de bord de visualisation des résultats