- Synchronisierte Single-Pass Audio- + Video-Generierung
- Natives 4K-Ausgabe mit bis zu 50 FPS
- Multimodale Konditionierung: Text, Bild, Video, Tiefe, Keyframes
- 19B-Parameter DiT-Architektur (14B Video + 5B Audio)
- Apache 2.0 Open-Source-Lizenz mit Modellgewichten und Code
- Text-to-Video- und Image-to-Video-Generierungsmodi
- Optimierungen für effiziente Inferenz (NVFP4/NVFP8)