- Schritt1: Klonen Sie das Dual Coding Agents GitHub-Repository.
- Schritt2: Installieren Sie Python-Abhängigkeiten mit pip install -r requirements.txt.
- Schritt3: Konfigurieren Sie Ihre API-Schlüssel für Vision- und Sprachmodelle.
- Schritt4: Passen Sie die Agenten-Prompt-Vorlagen an und wählen Sie den Bild-Encoder und das Sprachmodell in der Konfiguration.
- Schritt5: Führen Sie das Demo-Skript aus oder importieren Sie das Framework in Ihren Code, um Bildeingaben und Prompts zu verarbeiten.
- Schritt6: Überprüfen Sie die generierten Antworten und passen Sie Parameter oder Plugins für Ihre Anwendung an.