- Ingestion multimodale de documents (PDF, image, scans)
- Intégration OCR (Tesseract, PaddleOCR, etc.)
- Détection et extraction de tableaux
- Questions-réponses en vision-langage
- Résumé de documents
- Composants de pipeline configurables
- Orchestration et mise en cache des modèles