Query-Bot integra ingestão de documentos, segmentação de texto e embeddings vetoriais para construir um índice pesquisável a partir de PDFs, arquivos de texto e documentos Word. Usando LangChain e GPT-3.5 Turbo da OpenAI, processa as consultas do usuário ao recuperar trechos relevantes e gerar respostas concisas. A interface baseada em Streamlit permite aos usuários enviar arquivos, acompanhar o histórico de conversas e ajustar configurações. Pode ser implantado localmente ou em ambientes de nuvem, oferecendo uma estrutura extensível para agentes personalizados e bases de conhecimento.
Permite perguntas e respostas interativas sobre documentos do CUHKSZ via IA, usando LlamaIndex para recuperação de conhecimento e integração com LangChain.
Chat-With-CUHKSZ oferece um pipeline simplificado para construir um chatbot específico de domínio baseado na base de conhecimento do CUHKSZ. Após clonar o repositório, os usuários configuram suas credenciais de API do OpenAI e especificam fontes de documentos, como PDFs do campus, páginas da web e artigos de pesquisa. A ferramenta usa LlamaIndex para pré-processar e indexar os documentos, criando um armazenamento vetorial eficiente. O LangChain orquestra a recuperação e os prompts, entregando respostas relevantes em uma interface conversacional. A arquitetura suporta a adição de documentos personalizados, ajuste de estratégias de prompt e implantação via Streamlit ou um servidor Python. Também integra melhorias opcionais de busca semântica, suporta logging de consultas para auditoria, e pode ser estendido para outras universidades com configuração mínima.