- Paso 1: Clona el repositorio de Dual Coding Agents en GitHub.
- Paso 2: Instala las dependencias de Python usando pip install -r requirements.txt.
- Paso 3: Configura tus claves API para modelos de visión y lenguaje.
- Paso 4: Personaliza las plantillas de prompts del agente y elige el codificador de imágenes y el modelo de lenguaje en la configuración.
- Paso 5: Ejecuta el script de demostración o importa el marco en tu código para pasar entradas de imágenes y prompts.
- Paso 6: Revisa las respuestas generadas y ajusta parámetros o plugins según tu aplicación.