KI-Glossar
Das vollständige Wörterbuch der Künstlichen Intelligenz
Inférence de Débruitage Guidée
Processus d'inférence dans les modèles de diffusion où le débruitage progressif est orienté par une information externe (ex: image source) pour s'assurer que le résultat final respecte les contraintes imposées.
Encodage de Structure Sémantique
Technique visant à capturer et représenter la composition spatiale et les relations entre les objets d'une image source, souvent via des cartes de contours, de profondeur ou de segmentation, pour guider la génération.
Rééchantillonnage par Ancestral (Ancestral Sampling)
Méthode d'échantillonnage stochastique lors du débruitage qui ajoute une quantité de bruit à chaque étape, héritée de l'étape précédente, pour introduire de la variabilité et éviter des résultats trop déterministes.
Plongement Latent (Latent Embedding)
Représentation vectorielle de basse dimension d'une image source, générée par un encodeur (ex: VAE), qui est utilisée comme condition dans l'espace latent d'un modèle de diffusion pour une traduction image-à-image efficace.
Débruitage de Score de Langevin
Algorithme d'optimisation itératif qui utilise le gradient de la log-densité de probabilité (le score) pour raffiner progressivement un échantillon bruité vers une distribution de données cible, formant la base de l'échantillonnage des modèles de diffusion.
Carte d'Attention Croisée
Mécanisme dans les transformeurs qui permet au modèle de générer une image en pondérant dynamiquement l'importance de différentes parties de la condition (ex: tokens de texte ou patches d'une image source) à chaque étape de la génération.
Pipeline de Diffusion Latente (LDM)
Architecture de modèle de diffusion qui opère entièrement dans un espace latent compressé, obtenu via un VAE, pour réduire la complexité computationnelle tout en maintenant une haute qualité de génération d'images.
Prompt-to-Prompt
Méthode d'édition d'images par diffusion qui permet de modifier une image générée en modifiant son prompt de texte initial, tout en préservant la structure de l'image originale grâce à un alignement des cartes d'attention.
Plug-and-Play (PnP) Diffusion
Paradigme de résolution de problèmes inverses (ex: débruitage, super-résolution) qui utilise un modèle de diffusion pré-entraîné comme un a priori sur les images, en le combinant avec un modèle de données spécifique à la tâche sans réentraîner le diffuseur.