rag-services ist eine erweiterbare Plattform, die RAG-Pipelines in diskrete Mikroservices unterteilt. Es bietet einen Dokumentenspeicher-Service, einen Vektorindex-Service, einen Einbettungsdienst, mehrere LLM-Inferenzdienste und einen Orchestrator, der Arbeitsabläufe koordiniert. Jedes Modul stellt REST-APIs bereit, sodass Sie Datenbanken und Modellanbieter kombinieren können. Mit Unterstützung für Docker und Docker Compose können Sie es lokal oder in Kubernetes-Clustern bereitstellen. Das Framework ermöglicht skalierbare, fehlertolerante RAG-Lösungen für Chatbots, Wissensbasen und automatisierte Dokumenten-Q&A.