Modèles Hybrides Diffusion-Transformer
U-ViT
Variante du Vision Transformer où les connexions U-Net sont intégrées pour combiner efficacement les caractéristiques multi-échelles dans les modèles de diffusion.
← Retour