万能なLLM inferenceツール

多様な用途に対応可能なLLM inferenceツールを利用して、業務の効率化と柔軟性を実現しましょう。

LLM inference

  • rag-servicesは、ベクトルストレージ、LLM推論、オーケストレーションを備えたスケーラブルなリトリーブ拡張生成パイプラインを可能にするオープンソースのマイクロサービスフレームワークです。
    0
    0
    rag-servicesとは?
    rag-servicesは、RAGパイプラインを個別のマイクロサービスに分解する拡張可能なプラットフォームです。ドキュメントストアサービス、ベクトルインデックスサービス、エンベディング生成サービス、複数のLLM推論サービスと、ワークフローを調整するオーケストレータを提供します。各コンポーネントはREST APIを公開し、データベースやモデルプロバイダーを組み合わせることが可能です。DockerとDocker Composeをサポートし、ローカルまたはKubernetesクラスターに展開できます。このフレームワークは、チャットボット、ナレッジベース、自動ドキュメントQ&Aのためのスケーラブルでフォールトトレラントなソリューションを提供します。
フィーチャー