- Paso 1: Clona el repositorio e instala las dependencias de Python.
- Paso 2: Configura tu OPENAI_API_KEY y ajusta los parámetros de Whisper.
- Paso 3: Ejecuta el script del agente en modo CLI.
- Paso 4: Sube o especifica el documento objetivo (PDF, DOCX, TXT, imagen).
- Paso 5: Habla tu consulta en el micrófono.
- Paso 6: El agente transcribe tu voz y procesa el documento.
- Paso 7: Recibe respuestas o resúmenes generados por IA en la terminal.
- Paso 8: Ajusta los prompts o vuelve a subir diferentes archivos según sea necesario.