VisQueryPDF processa arquivos PDF segmentando-os em pedaços, gerando embedings vetoriais via modelos da OpenAI ou compatíveis, e armazenando esses embedings em um armazenamento vetorial local. Os usuários podem enviar consultas em linguagem natural para recuperar os pedaços mais relevantes. Os resultados de pesquisa são exibidos com texto destacado nas páginas originais de PDF e plotados em um espaço de embedings bidimensional, permitindo uma exploração interativa das relações semânticas entre segmentos do documento.
Recursos Principais do VisQueryPDF
Fragmentação e pré-processamento de PDFs
Geração de embedings vetoriais
Pesquisa semântica via consultas em linguagem natural
Destacar páginas de PDF de forma interativa
Visualização em gráfico de dispersão 2D de embedings