Difusión de Audio y Ondulatoria
Condicionamiento Texto-Audio
Técnica donde un modelo de difusión de audio es guiado por una descripción textual para generar un sonido correspondiente, requiriendo una arquitectura multimodal capaz de alinear las modalidades textuales y auditivas.
← Volver