Le système RAG piloté par LLM est un framework destiné aux développeurs pour la construction de pipelines RAG. Il fournit des modules pour l’intégration de collections de documents, l’indexation via FAISS, Pinecone ou Weaviate, et la récupération de contexte pertinent en temps réel. Le système utilise des wrappers LangChain pour orchestrer les appels LLM, supporte les modèles de prompt, la diffusion de réponses, et les adaptateurs multi-vecteurs. Il simplifie le déploiement de RAG de bout en bout pour des bases de connaissances, avec une personnalisation à chaque étape — de la configuration du modèle d’intégration à la conception du prompt et au post-traitement des résultats.