Transformers Audio
VALL-E
Modelo de síntesis de voz neural codec similar al lenguaje que utiliza Transformers para generar voz de alta calidad a partir de prompts de voz de 3 segundos.
← VolverModelo de síntesis de voz neural codec similar al lenguaje que utiliza Transformers para generar voz de alta calidad a partir de prompts de voz de 3 segundos.
← Volver