- 4K-Multishot-Videoerzeugung
- Native Audiosynthese und Lippen-Synchronisation
- Bilderzeugung im Thinking Mode
- Steuerung des ersten/letzten Frames
- 9-Gitter- und Multi-Referenz-Eingabe
- Text-zu-Bild- und Bild-zu-Bild-Workflows
- Charakterkonsistenz über Szenen hinweg
- Transparenter PNG-Export