rag-services es un marco de microservicios de código abierto que permite pipelines escalables de generación aumentada por recuperación con almacenamiento vectorial, inferencia LLM y orquestación.
rag-services es una plataforma extensible que descompone las pipelines RAG en microservicios discretos. Ofrece un servicio de almacenamiento de documentos, un servicio de indexación vectorial, un servicio de embedding, múltiples servicios de inferencia LLM y un orquestador para coordinar los flujos de trabajo. Cada componente expone APIs REST, permitiéndote mezclar y combinar bases de datos y proveedores de modelos. Con soporte para Docker y Docker Compose, puedes desplegar localmente o en clústeres Kubernetes. El framework habilita soluciones RAG escalables y tolerantes a fallos para chatbots, bases de conocimientos y Q&A automáticos.
UltiHash es una plataforma de almacenamiento de objetos de alto rendimiento compatible con S3, diseñada específicamente para cargas de trabajo de IA como IA generativa, entrenamiento de modelos, generación aumentada por recuperación y entornos de data lakehouse. Ayuda a los equipos a gestionar grandes cantidades de datos estructurados y no estructurados con rendimiento optimizado, desduplicación a nivel binario y opciones de implementación nativas de Kubernetes para mejorar la eficiencia de GPU/TPU y reducir costos de almacenamiento.