- Schritt 1: Klonen Sie das Repository und installieren Sie die Python-Abhängigkeiten.
- Schritt 2: Setzen Sie Ihren OPENAI_API_KEY und konfigurieren Sie Whisper-Einstellungen.
- Schritt 3: Führen Sie das Agent-Skript im CLI-Modus aus.
- Schritt 4: Laden Sie die Zieldatei hoch oder spezifizieren Sie sie (PDF, DOCX, TXT, Bild).
- Schritt 5: Sprechen Sie Ihre Anfrage in das Mikrofon.
- Schritt 6: Der Agent transkribiert Ihre Stimme und verarbeitet das Dokument.
- Schritt 7: Erhalten Sie KI-generierte Antworten oder Zusammenfassungen im Terminal.
- Schritt 8: Passen Sie Eingabeaufforderungen an oder laden Sie bei Bedarf andere Dateien hoch.