Modelos de Difusión
Autointeracción Cruzada
Mecanismo de atención que permite a los modelos de difusión fusionar eficazmente la información textual y visual durante la reducción de ruido. Esta arquitectura es crucial para la coherencia semántica en la generación de texto a imagen.
← Volver