- Arquitectura multimodal nativa que soporta entradas de texto, imagen, video y audio
- Generación de videos audiovisuales sincronizados en 1080p HD
- Aprendizaje por refuerzo con retroalimentación humana para mejorar la calidad
- Edición avanzada de imágenes con precisión a nivel de píxel
- Plataforma open-source bajo licencia Apache 2.0