- Architecture Dual‑Branch Diffusion Transformer pour la génération conjointe audio‑vidéo
- Lip‑sync parfait avec prise en charge multilingue
- Contrôles caméra cinématographiques (pan, tilt, zoom, orbite)
- Génération texte‑vers‑vidéo et image‑vers‑vidéo
- Création vidéo en temps réel avec un taux d'inférence 10× plus rapide
- Optimisation native pour la langue chinoise