Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Distribution de Valeur
Représentation complète de l'incertitude sur les retours futurs dans l'apprentissage par renforcement, modélisant l'ensemble des probabilités de chaque retour possible plutôt que seule son espérance.
Apprentissage par Renforcement Distributionnel
Paradigme de l'AR qui modélise explicitement la distribution complète des retours attendus pour capturer l'incertitude et la variabilité des résultats futurs.
Fonction Q Distributionnelle
Extension de la fonction Q-valeur qui retourne une distribution de probabilité sur les retours attendus au lieu d'une valeur scalaire unique.
Paramétrisation Atomique
Technique de discrétisation des distributions continues en ensembles finis de points (atomes) avec probabilités associées pour faciliter l'apprentissage computationnel.
Categorical Distributional RL (C51)
Algorithme pionnier qui modélise la distribution de retour comme une distribution catégorielle discrète sur un support fixe de valeurs.
Opérateur de Bellman Distributionnel
Généralisation de l'opérateur de Bellman classique qui s'applique aux distributions complètes plutôt qu'aux valeurs espérées uniquement.
Distance de Wasserstein
Métrique utilisée pour mesurer la similarité entre distributions de valeur dans l'espace des retours, permettant de capturer à la fois la localisation et la forme des distributions.
Projection Distributionnelle
Processus de projection de distributions continues sur un support discret prédéfini, essentiel pour l'implémentation pratique des algorithmes distributionnels.
Risque Distributionnel
Mesure de l'incertitude et de la variabilité dans les prédictions de retour, quantifiée à travers les moments statistiques supérieurs de la distribution de valeur.
Moments d'Ordre Supérieur
Statistiques (variance, skewness, kurtosis) décrivant la forme de la distribution de retour au-delà de la moyenne, capturant asymétrie et concentration des probabilités.
Variation Temporelle Distributionnelle
Évolution temporelle de la forme complète de la distribution de retour plutôt que seulement de sa valeur espérée, révélant des patterns de risque changeants.
Support Discret de Valeur
Ensemble fini et ordonné de valeurs sur lequel les distributions continues sont approximées dans les algorithmes distributionnels pratiques.
Propagation Distributionnelle
Processus de mise à jour des distributions de valeur à travers l'opérateur de Bellman, préservant l'information sur l'incertitude à chaque étape temporelle.
Stabilité Distributionnelle
Propriété de convergence des distributions de valeur vers une forme stable pendant l'apprentissage, garantissant la cohérence des estimations d'incertitude.