- Автоматизированный механизм бенчмаркинга
- Разнообразный набор задач (рассуждение, планирование, Вопросы и ответы, использование инструментов)
- Интерактивная веб-таблица лидеров
- Шаблоны для интеграции пользовательских агентов
- Поддержка Docker для воспроизводимости
- Отслеживание и визуализация метрик
- Рабочий процесс подачи с сообществом