Le cadre Controllable RAG offre une approche modulaire pour construire des systèmes de génération augmentée par récupération. Il permet de configurer et de chaîner les composants de récupération, les modules de mémoire et les stratégies de génération. Les développeurs peuvent brancher différents LLM, bases de données vectorielles et contrôleurs de politique pour ajuster la façon dont les documents sont récupérés et traités avant la génération. Basé sur Python, il comprend des utilitaires pour l'indexation, les requêtes, le suivi de l'historique de conversation et les flux de contrôle basés sur des actions, ce qui le rend idéal pour les chatbots, les assistants de connaissance et les outils de recherche.