Difusão Multimodal
Rede de Predição de Ruído Compartilhada
Componente central do modelo de difusão, frequentemente uma arquitetura U-Net, cujas camadas inferiores são compartilhadas entre as modalidades e as camadas superiores são especializadas.
← Voltar