- ステップ1:リポジトリをクローンしてPython依存関係をインストールします。
- ステップ2:OPENAI_API_KEYを設定し、Whisper設定を構成します。
- ステップ3:CLIモードでエージェントのスクリプトを実行します。
- ステップ4:対象のドキュメント(PDF、DOCX、TXT、画像)をアップロードまたは指定します。
- ステップ5:マイクに向かってクエリを話します。
- ステップ6:エージェントが声を書き起こし、ドキュメントを処理します。
- ステップ7:ターミナルでAI生成の回答または要約を受け取ります。
- ステップ8:必要に応じてプロンプトを調整したり、異なるファイルを再アップロードします。