- Step1: Clone o repositório WorFBench do GitHub
- Step2: Instale dependências via pip ou conda
- Step3: Configure chaves de API e endpoints de modelos em config.yaml
- Step4: Selecione ou defina tarefas de benchmarking na pasta tasks
- Step5: Execute scripts de avaliação para colocar agentes em ação contra as tarefas
- Step6: Use as ferramentas de visualização fornecidas para analisar os resultados
- Step7: Estenda ou personalize tarefas e métricas para novos experimentos