- Arquitetura multimodal nativa que suporta entradas de texto, imagem, vídeo e áudio
- Geração sincronizada de vídeos audiovisuais 1080p HD
- Aprendizado por reforço com feedback humano para melhoria da qualidade
- Edição avançada de imagem com precisão em nível de pixel
- Plataforma open-source licenciada pela Apache 2.0