- Automatisierter Benchmarking-Harness
- Vielfältige Aufgabenliste (Schlussfolgerung, Planung, Q&A, Tool-Nutzung)
- Interaktive webbasierte Rangliste
- Benutzerdefinierte Agenten-Integrationsvorlagen
- Docker-Unterstützung für Reproduzierbarkeit
- Metrik-Tracking und Visualisierung
- Community-Einreichungsworkflow