- Generación de video desde texto e imagen
- Alineación nativa de audio y sincronización labial
- Renderizado basado en física para movimiento realista
- Dirección multi-tomas con estado mundial consistente
- Función Cameo para personalizar videos con personas reales