Мощные LLM inference инструменты

Спонсируется FixArt AI - FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.



FixArt AI - FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.





Новости ИИ

Войти

LLM inference

rag-services
rag-services — это фреймворк с открытым исходным кодом для микросервисов, обеспечивающий масштабируемые конвейеры генерации с использованием поиска и векторного хранилища, inference LLM и оркестрации.

0


0
Посетить ИИ
Что такое rag-services?
rag-services — это расширяемая платформа, разбивающая пайплайны RAG на отдельные микросервисы. Предоставляет сервис хранения документов, сервис индексирования векторов, сервис embedding, несколько сервисов inference LLM и оркестратор для координации рабочих процессов. Каждый компонент предоставляет REST API, позволяющее сочетать базы данных и поставщиков моделей. Поддержка Docker и Docker Compose позволяет развертывать локально или в кластерах Kubernetes. Фреймворк обеспечивает масштабируемые и отказоустойчивые решения RAG для чатботов, баз знаний и автоматизированных вопросов и ответов.
Основные функции rag-services

Сервис хранения документов

Векторное индексирование и поиск

Генерация embedding

Несколько точек входа LLM

API оркестрации рабочих процессов



Рекомендуемые

LLM inference

rag-services