Query-Bot integra la ingestión de documentos, segmentación de texto y embeddings vectoriales para construir un índice buscable a partir de PDFs, archivos de texto y documentos Word. Usando LangChain y GPT-3.5 Turbo de OpenAI, procesa las consultas del usuario recuperando pasajes relevantes y generando respuestas concisas. La interfaz basada en Streamlit permite a los usuarios cargar archivos, seguir el historial de conversaciones y ajustar configuraciones. Puede desplegarse localmente o en entornos en la nube, ofreciendo un marco extensible para agentes personalizados y bases de conocimientos.
Permite preguntas y respuestas interactivas sobre documentos de CUHKSZ a través de IA, aprovechando LlamaIndex para recuperación de conocimientos e integración con LangChain.
Chat-With-CUHKSZ ofrece un flujo de trabajo simplificado para construir un chatbot específico en el dominio basado en la base de conocimientos de CUHKSZ. Después de clonar el repositorio, los usuarios configuran sus credenciales de la API de OpenAI y especifican las fuentes de documentos, como PDFs del campus, páginas web y artículos de investigación. La herramienta usa LlamaIndex para preprocesar e indexar los documentos, creando una tienda vectorial eficiente. LangChain orquesta la recuperación y las solicitudes, entregando respuestas relevantes en una interfaz conversacional. La arquitectura admite añadir documentos personalizados, ajustar las estrategias de solicitudes y desplegar vía Streamlit o un servidor Python. También integra mejoras opcionales de búsqueda semántica, soporta registros de consultas para auditoría y puede extenderse a otras universidades con configuración mínima.