Difusão de Áudio e Ondulatória
Condicionamento Texto-Áudio
Técnica onde um modelo de difusão de áudio é guiado por uma descrição textual para gerar um som correspondente, exigindo uma arquitetura multimodal capaz de alinhar as modalidades textuais e auditivas.
← Voltar