- Invites multimodales (texte + image/vidéo) pour orienter la génération musicale
- Génération automatique de paroles à partir de l'intention du prompt
- Audio court haute‑fidélité (≈30 s) avec voix et arrangement
- Watermark SynthID pour la provenance et la vérification
- Concept d'API de streaming Lyria RealTime pour un contrôle interactif à faible latence (piste séparée)
- Génération de pochette en parallèle de l'audio