Transformers Audio
VALL-E
Modèle de synthesis vocale neural codec language utilisant Transformers pour générer parole haute qualité à partir de prompts vocaux de 3 secondes.
← WsteczModèle de synthesis vocale neural codec language utilisant Transformers pour générer parole haute qualité à partir de prompts vocaux de 3 secondes.
← Wstecz