🏠 Home
Benchmark Hub
📊 All Benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List Applications 🎨 Creative Free Pages 🎯 FSACB - Ultimate Showcase 🌍 Translation Benchmark
Models
🏆 Top 10 Models 🆓 Free Models 📋 All Models ⚙️ Kilo Code
Resources
💬 Prompts Library 📖 AI Glossary 🔗 Useful Links

AI Glossary

The complete dictionary of Artificial Intelligence

162
categories
2,032
subcategories
23,060
terms
📖
terms

Quantile Regression DRL

Approche d'apprentissage par renforcement profond modélisant la distribution complète des retours attendus plutôt que leur seule espérance, utilisant la régression quantile pour estimer les quantiles de la distribution de valeur.

📖
terms

Wasserstein Distance in DRL

Métrique de distance entre distributions utilisée dans le DRL distributionnel pour mesurer la dissimilarité entre les distributions de retour prédites et cibles, favorisant une meilleure stabilité de l'apprentissage.

📖
terms

Value Distribution Modeling

Technique consistant à approximer la distribution complète des retours attendus pour chaque état-action plutôt que leur seule espérance, capturant l'incertitude et la variabilité inhérentes à l'environnement.

📖
terms

Expectile Regression RL

Variante du DRL distributionnel utilisant la régression expectile plutôt que quantile, offrant une asymétrie contrôlable dans l'estimation de la distribution de retour particulièrement adaptée aux contextes risk-sensibles.

📖
terms

Probabilistic Return Distribution

Représentation probabiliste complète des retours futurs attendus pour chaque paire état-action, caractérisant non seulement la moyenne mais aussi la variance, l'asymétrie et d'autres moments statistiques.

📖
terms

Distributional Projected Bellman Update

Procédure de mise à jour projetant la distribution de retour cible sur l'espace de distributions supportées, assurant la cohérence et la stabilité de l'apprentissage dans le cadre distributionnel.

📖
terms

Tail Risk Assessment in DRL

Capacité du DRL distributionnel à évaluer quantitativement les risques extrêmes (tail risk) en analysant les queues de distribution des retours, crucial pour les applications critiques.

📖
terms

Quantile Sampling Strategies

Techniques d'échantillonnage des quantiles dans le cadre du QR-DRL, incluant l'échantillonnage uniforme, adaptatif ou basé sur l'importance pour optimiser l'efficacité de l'apprentissage de la distribution.

🔍

No results found