- Нативное многокадровое повествование из одного запроса
- Dual-Branch Diffusion Transformer для совместной генерации видео+аудио
- Киношная 2K-вывод за менее чем 60 секунд
- Фонем-уровневая синхронизация губ более чем на 8 языках
- Постоянная идентичность персонажей между сценами
- Изображение→видео с синтезом движения и сохранением лица
- RESTful API для интеграции и генерации через API за <10s