- Ingestão de documentos multimodais (PDF, imagem, digitalizado)
- Integração OCR (Tesseract, PaddleOCR, etc.)
- Detecção e extração de tabelas
- Perguntas e respostas de visão-linguagem
- Sumarização de documentos
- Componentes de pipeline personalizáveis
- Orquestração de modelos e cache