- Schritt 1: Klonen Sie das Repository: git clone https://github.com/Jenqyang/LLM-Powered-RAG-System.git
- Schritt 2: Installieren Sie die Abhängigkeiten: pip install -r requirements.txt
- Schritt 3: Konfigurieren Sie Umgebungsvariablen für Ihren LLM-API-Schlüssel und Vektorspeicheranmeldeinformationen
- Schritt 4: Bereiten Sie Ihren Dokumentenkorpus für die Einbettung vor und preprocessen Sie ihn
- Schritt 5: Erstellen oder laden Sie den Vektorindex (FAISS, Pinecone, Weaviate)
- Schritt 6: Starten Sie den RAG-Server oder das Notebook, um Anfragen zu stellen und den erweiternden Kontext abzurufen
- Schritt 7: Passen Sie Prompt-Vorlagen und Abruffenparameter in den Konfigurationsdateien an
- Schritt 8: Bereitstellung als REST-API oder Integration in Ihre Anwendung