DocGPT vise à simplifier l'extraction d'informations et les questions-réponses à partir de documents en fournissant une interface conversationnelle fluide. Les utilisateurs peuvent télécharger des documents en formats PDF, Word ou PowerPoint, qui sont ensuite traités par des parsers de texte. Le contenu est découpé en segments et embedded avec les modèles d'embedding d'OpenAI, puis stocké dans une base de données vectorielle comme FAISS ou Pinecone. Lorsqu’un utilisateur soumet une requête, DocGPT récupère les segments de texte les plus pertinents via une recherche par similarité et utilise ChatGPT pour générer des réponses précises et contextualisées. Il propose un chat interactif, une synthèse de documents, des invites personnalisables pour des besoins spécifiques au domaine, et est construit en Python avec une interface Streamlit pour un déploiement et une extension faciles.