rag-services é uma plataforma extensível que divide pipelines RAG em microsserviços discretos. Oferece um serviço de armazenamento de documentos, um serviço de índice vetorial, um serviço de embedder, múltiplos serviços de inferência de LLM e um serviço de orquestração para coordenar fluxos de trabalho. Cada componente expõe APIs REST, permitindo combinar bancos de dados e provedores de modelos. Com suporte a Docker e Docker Compose, pode ser implantado localmente ou em clusters Kubernetes. A estrutura permite soluções RAG escaláveis e tolerantes a falhas para chatbots, bases de conhecimento e respostas automáticas a documentos.