- Étape 1 : pip install gym-llm
- Étape 2 : importer gym et enregistrer une environnement gym-llm
- Étape 3 : configurer votre politique d’agent LLM ou RL
- Étape 4 : exécuter la boucle d’entraînement avec env.step(), env.reset()
- Étape 5 : évaluer la performance de l’agent et ajuster la récompense ou les invites