- Architecture multimodale native prenant en charge les entrées texte, image, vidéo et audio
- Génération synchronisée de vidéos audiovisuelles 1080p HD
- Apprentissage par renforcement avec feedback humain pour améliorer la qualité
- Édition d’image avancée avec une précision au niveau du pixel
- Plateforme open-source sous licence Apache 2.0