- Архитектура Dual-Branch Diffusion Transformer для совместной генерации аудио и видео
- Идеальный рипсинк с поддержкой нескольких языков
- Кинематографическое управление камерой (панорамирование, наклон, масштаб, орбита)
- Генерация из текста в видео и из изображения в видео
- Создание видео в реальном времени с ускорением вывода в 10 раз
- Нативная оптимизация для китайского языка