Modèles de Diffusion

📖

termes

Architecture générative qui utilise un processus progressif d'ajout et de retrait de bruit pour transformer les données en bruit pur puis reconstruire des échantillons réalistes. Ces modèles excellent dans la génération d'images de haute qualité avec une stabilité d'entraînement supérieure aux GANs.

📖

termes

Processus de Diffusion Avant

Phase d'entraînement où le bruit gaussien est progressivement ajouté aux données originales sur plusieurs pas temporels pour atteindre une distribution de bruit pur. Ce processus Markovien est conçu pour être réversible et prédictible mathématiquement.

📖

termes

Processus de Diffusion Inverse

Phase de génération où un réseau neuronal apprend à débruiter progressivement une distribution de bruit pur pour reconstruire des données cohérentes. Ce processus est guidé par l'estimation du gradient de score de la distribution de données.

📖

termes

DDPM (Denoising Diffusion Probabilistic Models)

Classe fondamentale de modèles de diffusion introduite par Ho et al. en 2020, utilisant un schedule de variance linéaire et un objectif de prédiction du bruit. DDPM établit les bases mathématiques pour les architectures de diffusion modernes.

📖

termes

Noise Schedule

Paramétrage temporel contrôlant la quantité de bruit ajoutée à chaque étape du processus de diffusion avant. Un schedule bien conçu optimise l'équilibre entre la préservation de l'information et l'efficacité du débruitage.

📖

termes

Guidance Classifier-Free

Technique de contrôle de génération qui combine des prédictions conditionnelles et non-conditionnelles pour améliorer la fidélité au texte sans nécessiter de classifieur externe. Cette méthode permet un contrôle fin de la génération tout en préservant la diversité.

📖

termes

Latent Diffusion Models

Architecture optimisant les modèles de diffusion en travaillant dans un espace latent compressé plutôt que directement sur l'espace pixel. Cette approche réduit drastiquement les coûts computationnels tout en maintenant une qualité de génération élevée.

📖

termes

Échantillonnage Ancestral

Méthode d'échantillonnage stochastique qui combine débruitage déterministe et ajout contrôlé de bruit pour améliorer la diversité des échantillons générés. Cette technique équilibre qualité et créativité dans la génération.

📖

termes

Timesteps de Diffusion

Nombre discret d'étapes utilisées dans le processus de diffusion, typiquement entre 100 et 1000 pas pour un équilibre optimal qualité-performance. La sélection des timesteps influence directement la finesse des détails générés.

📖

termes

U-Net de Débruitage

Architecture neuronale avec connexions résiduelles et attention, spécifiquement conçue pour prédire et retirer le bruit à chaque étape de diffusion. La structure U-Net préserve efficacement les informations spatiales tout en capturant les dépendances globales.

📖

termes

Équations Différentielles Stochastiques

Formulation mathématique continue unifiant les processus de diffusion avant et inverse dans un cadre théorique rigoureux. Cette approche permet l'analyse théorique et le développement de nouveaux algorithmes d'échantillonnage.

📖

termes

Diffusion Conditionnelle

Extension des modèles de diffusion intégrant des conditions externes comme le texte, les images ou les classes pour guider la génération. Cette approche permet un contrôle précis sur les caractéristiques des échantillons générés.

📖

termes

Scale de Guidance

Paramètre contrôlant l'influence des conditions sur le processus de génération, permettant d'ajuster le compromis entre fidélité et créativité. Une scale élevée renforce l'adhérence aux instructions tandis qu'une scale faible favorise la diversité.

📖

termes

Rééchantillonnage Progressif

Technique d'amélioration itérative appliquant plusieurs cycles de débruitage pour affiner les détails et corriger les artefacts. Cette méthode optimise la qualité finale des générations au coût d'un temps de calcul accru.

📖

termes

Self-Attention Croisée

Mécanisme d'attention permettant aux modèles de diffusion de fusionner efficacement les informations textuelles et visuelles pendant le débruitage. Cette architecture est cruciale pour la cohérence sémantique dans la génération text-to-image.

📖

termes

DDIM (Denoising Diffusion Implicit Models)

Variante déterministe des modèles de diffusion permettant un échantillonnage accéléré avec moins de pas tout en préservant la qualité. DDIM transforme le processus stochastique en un mappage déterministe non-markovien.

Glossaire IA