- API unificada para múltiples modelos de lenguaje
- Soporte para backend de modelos local y alojado
- Plantillas de solicitud y gestión de pipelines
- Procesamiento en lotes y streaming de respuestas
- Cambio entre backends de GPU y CPU
- Utilidades para caché de respuestas y benchmarking