- Passo 1: pip install gym-llm
- Passo 2: importe gym e registre um ambiente gym-llm
- Passo 3: configure sua política de LLM ou agente de RL
- Passo 4: execute o ciclo de treinamento usando env.step(), env.reset()
- Passo 5: avalie o desempenho do agente e ajuste recompensa ou prompts