- Prompts multimodales (texto + imagen/vídeo) para orientar la generación musical
- Generación automática de letras a partir de la intención del prompt
- Audio de alta fidelidad en formato corto (≈30 s) con voces y arreglo
- Marca de agua SynthID para procedencia y verificación
- Concepto de API de streaming Lyria RealTime para control interactivo de baja latencia (pista separada)
- Generación de portada junto con el audio