rag-services es una plataforma extensible que descompone las pipelines RAG en microservicios discretos. Ofrece un servicio de almacenamiento de documentos, un servicio de indexación vectorial, un servicio de embedding, múltiples servicios de inferencia LLM y un orquestador para coordinar los flujos de trabajo. Cada componente expone APIs REST, permitiéndote mezclar y combinar bases de datos y proveedores de modelos. Con soporte para Docker y Docker Compose, puedes desplegar localmente o en clústeres Kubernetes. El framework habilita soluciones RAG escalables y tolerantes a fallos para chatbots, bases de conocimientos y Q&A automáticos.