- 1단계: 저장소를 복제하고 Python 의존성을 설치하세요.
- 2단계: OPENAI_API_KEY를 설정하고 Whisper 설정을 구성하세요.
- 3단계: CLI 모드에서 에이전트 스크립트를 실행하세요.
- 4단계: 대상 문서(PDF, DOCX, TXT, 이미지)를 업로드하거나 지정하세요.
- 5단계: 마이크에 질문을 하세요.
- 6단계: 에이전트가 음성을 전사하고 문서를 처리합니다.
- 7단계: 터미널에서 AI가 생성한 답변이나 요약을 받습니다.
- 8단계: 필요에 따라 프롬프트를 조정하거나 다른 파일을 재업로드하세요.