Stable Diffusion
Text Encoder (CLIP)
Composant qui transforme le texte de description (prompt) en un vecteur numérique dans l'espace latent, guidant le modèle de diffusion pour générer une image correspondante.
← पीछे