KI-Glossar
Das vollständige Wörterbuch der Künstlichen Intelligenz
Quantile Regression DRL
Approche d'apprentissage par renforcement profond modélisant la distribution complète des retours attendus plutôt que leur seule espérance, utilisant la régression quantile pour estimer les quantiles de la distribution de valeur.
Wasserstein Distance in DRL
Métrique de distance entre distributions utilisée dans le DRL distributionnel pour mesurer la dissimilarité entre les distributions de retour prédites et cibles, favorisant une meilleure stabilité de l'apprentissage.
Value Distribution Modeling
Technique consistant à approximer la distribution complète des retours attendus pour chaque état-action plutôt que leur seule espérance, capturant l'incertitude et la variabilité inhérentes à l'environnement.
Expectile Regression RL
Variante du DRL distributionnel utilisant la régression expectile plutôt que quantile, offrant une asymétrie contrôlable dans l'estimation de la distribution de retour particulièrement adaptée aux contextes risk-sensibles.
Probabilistic Return Distribution
Représentation probabiliste complète des retours futurs attendus pour chaque paire état-action, caractérisant non seulement la moyenne mais aussi la variance, l'asymétrie et d'autres moments statistiques.
Distributional Projected Bellman Update
Procédure de mise à jour projetant la distribution de retour cible sur l'espace de distributions supportées, assurant la cohérence et la stabilité de l'apprentissage dans le cadre distributionnel.
Tail Risk Assessment in DRL
Capacité du DRL distributionnel à évaluer quantitativement les risques extrêmes (tail risk) en analysant les queues de distribution des retours, crucial pour les applications critiques.
Quantile Sampling Strategies
Techniques d'échantillonnage des quantiles dans le cadre du QR-DRL, incluant l'échantillonnage uniforme, adaptatif ou basé sur l'importance pour optimiser l'efficacité de l'apprentissage de la distribution.