Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Rééchantillonnage (Reparameterization Trick)
Technique permettant la différenciation du processus d'échantillonnage aléatoire du VAE en décomposant la variable aléatoire en une partie déterministe et une partie stochastique indépendante, facilitant la rétropropagation du gradient.
Borne Inférieure Variationnelle (ELBO)
Objectif d'optimisation des VAE, équivalant à la log-vraisemblance des données moins la divergence KL, servant de proxy tractable pour maximiser la vraisemblance des données observées.
Modèle de Dynamique Latent
Modèle apprenant la transition d'états dans l'espace latent, prédisant la représentation latente suivante à partir de l'état latent actuel et de l'action, réduisant la complexité de la modélisation de la dynamique de l'environnement.
Planification dans l'Espace Latent
Stratégie où l'agent recherche une séquence d'actions optimales en utilisant le modèle de dynamique latent pour simuler les conséquences futures sans interagir directement avec l'environnement réel.
Modèle du Monde (World Model)
Architecture combinant un VAE pour la perception, un modèle de dynamique (RNN ou MDP) pour la prédiction d'états latents, et un agent de contrôle (policy) opérant entièrement dans cet espace latent simulé.
Distribution Postérieure Approximative (q)
Distribution paramétrée par le réseau encodeur qui approxime la vraie distribution postérieure des variables latentes conditionnellement aux observations, rendant l'inférence tractable.
Distribution A Priori (p)
Distribution choisie pour les variables latentes, typiquement une gaussienne isotropique standard, servant de régularisateur pour structurer l'espace latent et éviter le sur-apprentissage.
Autoencodeur Déterministe vs. Stochastique
Distinction où l'autoencodeur déterministe mappe chaque entrée à un point latent unique, tandis que le VAE stochastique mappe chaque entrée à une distribution, capturant l'incertitude et permettant la génération de données nouvelles.
Facteur de Beta (β-VAE)
Hyperparamètre pondérant le terme de régularisation KL dans la fonction de perte ELBO, contrôlant le compromis entre la qualité de reconstruction et le degré de désenchevêtrement (disentanglement) des facteurs latents.
Désenchevêtrement des Représentations (Disentanglement)
Propriété d'un espace latent où chaque dimension correspond de manière interprétable à un facteur de variation sémantique indépendant dans les données, améliorant la généralisation et l'interprétabilité du modèle.
Modèle de Transition Latent
Composant du modèle du monde qui prédit la distribution de l'état latent suivant en se basant sur l'état latent actuel et l'action appliquée, formant la base de la simulation imagée (imagination) pour le planificateur.
Agent de Contrôle (Controller)
Politique ou réseau de neurones prenant des décisions d'actions, qui dans le cadre des modèles du monde, est entraîné à l'aide d'expériences générées dans l'espace latent plutôt que depuis l'environnement réel.