Transformers Audio
VALL-E
Modèle de synthesis vocale neural codec language utilisant Transformers pour générer parole haute qualité à partir de prompts vocaux de 3 secondes.
← GeriModèle de synthesis vocale neural codec language utilisant Transformers pour générer parole haute qualité à partir de prompts vocaux de 3 secondes.
← Geri