- Шаг 1: клонируйте репозиторий и установите зависимости Python.
- Шаг 2: настройте OPENAI_API_KEY и параметры Whisper.
- Шаг 3: запустите скрипт агента в режиме CLI.
- Шаг 4: загрузите или укажите целевой документ (PDF, DOCX, TXT, изображение).
- Шаг 5: скажите вашу команду в микрофон.
- Шаг 6: агент транскрибирует ваш голос и обрабатывает файл.
- Шаг 7: получите ответы или краткие отчеты через терминал.
- Шаг 8: при необходимости настройте подсказки или повторно загрузите разные файлы.