- Geração de vídeo a partir de texto com narrativa em vários planos
- Transformação de imagem em vídeo mantendo consistência de sujeitos
- Geração Dual Branch produzindo áudio e vídeo sincronizados
- Sincronização labial a nível de fonema em 8+ idiomas
- Síntese de movimento natural para movimentos realistas e estáveis
- Suporte para múltiplas proporções de aspecto e até 2K de resolução
- Controle de estilo versátil (fotorrealista, anime, stop motion)