Image-to-Image Translation

📖

Begriffe

Inférence de Débruitage Guidée

Processus d'inférence dans les modèles de diffusion où le débruitage progressif est orienté par une information externe (ex: image source) pour s'assurer que le résultat final respecte les contraintes imposées.

📖

Begriffe

Encodage de Structure Sémantique

Technique visant à capturer et représenter la composition spatiale et les relations entre les objets d'une image source, souvent via des cartes de contours, de profondeur ou de segmentation, pour guider la génération.

📖

Begriffe

Rééchantillonnage par Ancestral (Ancestral Sampling)

Méthode d'échantillonnage stochastique lors du débruitage qui ajoute une quantité de bruit à chaque étape, héritée de l'étape précédente, pour introduire de la variabilité et éviter des résultats trop déterministes.

📖

Begriffe

Plongement Latent (Latent Embedding)

Représentation vectorielle de basse dimension d'une image source, générée par un encodeur (ex: VAE), qui est utilisée comme condition dans l'espace latent d'un modèle de diffusion pour une traduction image-à-image efficace.

📖

Begriffe

Débruitage de Score de Langevin

Algorithme d'optimisation itératif qui utilise le gradient de la log-densité de probabilité (le score) pour raffiner progressivement un échantillon bruité vers une distribution de données cible, formant la base de l'échantillonnage des modèles de diffusion.

📖

Begriffe

Carte d'Attention Croisée

Mécanisme dans les transformeurs qui permet au modèle de générer une image en pondérant dynamiquement l'importance de différentes parties de la condition (ex: tokens de texte ou patches d'une image source) à chaque étape de la génération.

📖

Begriffe

Pipeline de Diffusion Latente (LDM)

Architecture de modèle de diffusion qui opère entièrement dans un espace latent compressé, obtenu via un VAE, pour réduire la complexité computationnelle tout en maintenant une haute qualité de génération d'images.

📖

Begriffe

Prompt-to-Prompt

Méthode d'édition d'images par diffusion qui permet de modifier une image générée en modifiant son prompt de texte initial, tout en préservant la structure de l'image originale grâce à un alignement des cartes d'attention.

📖

Begriffe

Plug-and-Play (PnP) Diffusion

Paradigme de résolution de problèmes inverses (ex: débruitage, super-résolution) qui utilise un modèle de diffusion pré-entraîné comme un a priori sur les images, en le combinant avec un modèle de données spécifique à la tâche sans réentraîner le diffuseur.

KI-Glossar

Inférence de Débruitage Guidée

Encodage de Structure Sémantique

Rééchantillonnage par Ancestral (Ancestral Sampling)

Plongement Latent (Latent Embedding)

Débruitage de Score de Langevin

Carte d'Attention Croisée

Pipeline de Diffusion Latente (LDM)

Prompt-to-Prompt

Plug-and-Play (PnP) Diffusion

Keine Ergebnisse gefunden