- Generación de texto a vídeo con narrativa multi‑toma
- Transformación de imagen a vídeo con consistencia de sujeto
- Generación Dual Branch produciendo audio y vídeo sincronizados
- Sincronización labial a nivel de fonema en 8+ idiomas
- Síntesis de movimiento natural para movimiento realista y estable
- Soporte para múltiples relaciones de aspecto y hasta 2K de resolución
- Control de estilo versátil (fotorrealista, anime, stop motion)