Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Modèles de Diffusion
Architecture générative qui utilise un processus progressif d'ajout et de retrait de bruit pour transformer les données en bruit pur puis reconstruire des échantillons réalistes. Ces modèles excellent dans la génération d'images de haute qualité avec une stabilité d'entraînement supérieure aux GANs.
Processus de Diffusion Avant
Phase d'entraînement où le bruit gaussien est progressivement ajouté aux données originales sur plusieurs pas temporels pour atteindre une distribution de bruit pur. Ce processus Markovien est conçu pour être réversible et prédictible mathématiquement.
Processus de Diffusion Inverse
Phase de génération où un réseau neuronal apprend à débruiter progressivement une distribution de bruit pur pour reconstruire des données cohérentes. Ce processus est guidé par l'estimation du gradient de score de la distribution de données.
DDPM (Denoising Diffusion Probabilistic Models)
Classe fondamentale de modèles de diffusion introduite par Ho et al. en 2020, utilisant un schedule de variance linéaire et un objectif de prédiction du bruit. DDPM établit les bases mathématiques pour les architectures de diffusion modernes.
Noise Schedule
Paramétrage temporel contrôlant la quantité de bruit ajoutée à chaque étape du processus de diffusion avant. Un schedule bien conçu optimise l'équilibre entre la préservation de l'information et l'efficacité du débruitage.
Guidance Classifier-Free
Technique de contrôle de génération qui combine des prédictions conditionnelles et non-conditionnelles pour améliorer la fidélité au texte sans nécessiter de classifieur externe. Cette méthode permet un contrôle fin de la génération tout en préservant la diversité.
Latent Diffusion Models
Architecture optimisant les modèles de diffusion en travaillant dans un espace latent compressé plutôt que directement sur l'espace pixel. Cette approche réduit drastiquement les coûts computationnels tout en maintenant une qualité de génération élevée.
Échantillonnage Ancestral
Méthode d'échantillonnage stochastique qui combine débruitage déterministe et ajout contrôlé de bruit pour améliorer la diversité des échantillons générés. Cette technique équilibre qualité et créativité dans la génération.
Timesteps de Diffusion
Nombre discret d'étapes utilisées dans le processus de diffusion, typiquement entre 100 et 1000 pas pour un équilibre optimal qualité-performance. La sélection des timesteps influence directement la finesse des détails générés.
U-Net de Débruitage
Architecture neuronale avec connexions résiduelles et attention, spécifiquement conçue pour prédire et retirer le bruit à chaque étape de diffusion. La structure U-Net préserve efficacement les informations spatiales tout en capturant les dépendances globales.
Équations Différentielles Stochastiques
Formulation mathématique continue unifiant les processus de diffusion avant et inverse dans un cadre théorique rigoureux. Cette approche permet l'analyse théorique et le développement de nouveaux algorithmes d'échantillonnage.
Diffusion Conditionnelle
Extension des modèles de diffusion intégrant des conditions externes comme le texte, les images ou les classes pour guider la génération. Cette approche permet un contrôle précis sur les caractéristiques des échantillons générés.
Scale de Guidance
Paramètre contrôlant l'influence des conditions sur le processus de génération, permettant d'ajuster le compromis entre fidélité et créativité. Une scale élevée renforce l'adhérence aux instructions tandis qu'une scale faible favorise la diversité.
Rééchantillonnage Progressif
Technique d'amélioration itérative appliquant plusieurs cycles de débruitage pour affiner les détails et corriger les artefacts. Cette méthode optimise la qualité finale des générations au coût d'un temps de calcul accru.
Self-Attention Croisée
Mécanisme d'attention permettant aux modèles de diffusion de fusionner efficacement les informations textuelles et visuelles pendant le débruitage. Cette architecture est cruciale pour la cohérence sémantique dans la génération text-to-image.
DDIM (Denoising Diffusion Implicit Models)
Variante déterministe des modèles de diffusion permettant un échantillonnage accéléré avec moins de pas tout en préservant la qualité. DDIM transforme le processus stochastique en un mappage déterministe non-markovien.