- Шаг 1: Клонируйте репозиторий WorFBench с GitHub
- Шаг 2: Установите зависимости через pip или conda
- Шаг 3: Настройте API-ключи и конечные точки модели в config.yaml
- Шаг 4: Выберите или определите задачи в папке tasks
- Шаг 5: Запустите скрипты оценки для тестирования агентов по задачам
- Шаг 6: Используйте встроенные инструменты визуализации для анализа результатов
- Шаг 7: Расширяйте или настраивайте задачи и метрики для новых экспериментов