Text-to-Image Generation
UNet
Architecture de réseau neuronal convolutif en forme de U, utilisée dans les modèles de diffusion pour prédire et retirer le bruit à chaque étape de génération.
← Zurück