DALI ermöglicht die interaktive Abfrage und Analyse multimodaler Dokumente mit integrierten Vision- und Sprachmodellen zur Extraktion strukturierter Informationen.
DALI bietet ein modulares, erweiterbares SDK zum Aufbau von Document AI-Agenten, die Bilder, PDFs und gescannte Dateien verarbeiten können. Es integriert OCR-Engines und visuelle Sprachmodelle, um Layout-Elemente zu erkennen, Tabellen zu extrahieren und Benutzerfragen zu beantworten. Entwickler können Pipelines anpassen, verschiedene LLMs integrieren und interaktive Web- oder Kommandozeilenschnittstellen bereitstellen. Mit integrierter Unterstützung für Caching, Batch-Verarbeitung und Multi-Model-Orchestrierung beschleunigt DALI Document-Understanding-Aufgaben mit minimalem Codeaufwand.