Query-Bot интегрирует загрузку документов, сегментацию текста и векторные вставки для создания поискового индекса из PDF, текстовых файлов и документов Word. Используя LangChain и GPT-3.5 Turbo от OpenAI, он обрабатывает пользовательские запросы, извлекая релевантные части документов и генерируя краткие ответы. Интерфейс на базе Streamlit позволяет пользователям загружать файлы, отслеживать историю разговоров и настраивать параметры. Его можно развернуть локально или в облачных средах, предлагая расширяемую платформу для пользовательских агентов и баз знаний.
Chat-With-CUHKSZ предоставляет упрощённую платформу для создания специализированного чатбота на основе базы знаний CUHKSZ. После клонирования репозитория пользователи настраивают свои учетные данные API OpenAI и указывают источники документов, такие как PDFs кампуса, веб-страницы и научные статьи. Инструмент использует LlamaIndex для предварительной обработки и индексации документов, создавая эффективное векторное хранилище. LangChain управляет извлечением информации и подсказками, доставляя релевантные ответы в диалоговом интерфейсе. Архитектура поддерживает добавление пользовательских документов, настройку стратегий подсказок и развертывание через Streamlit или Python-сервер. Также доступны опциональные улучшения семантического поиска, ведение журналов запросов для аудита и возможность расширения на другие университеты с минимальной настройкой.