🏠 Startseite
Vergleiche
📊 Alle Benchmarks 🦖 Dinosaurier v1 🦖 Dinosaurier v2 ✅ To-Do-Listen-Apps 🎨 Kreative freie Seiten 🎯 FSACB - Ultimatives Showcase 🌍 Übersetzungs-Benchmark
Modelle
🏆 Top 10 Modelle 🆓 Kostenlose Modelle 📋 Alle Modelle ⚙️ Kilo Code
Ressourcen
💬 Prompt-Bibliothek 📖 KI-Glossar 🔗 Nützliche Links

KI-Glossar

Das vollständige Wörterbuch der Künstlichen Intelligenz

162
Kategorien
2.032
Unterkategorien
23.060
Begriffe
📖
Begriffe

Quantile Regression DRL

Approche d'apprentissage par renforcement profond modélisant la distribution complète des retours attendus plutôt que leur seule espérance, utilisant la régression quantile pour estimer les quantiles de la distribution de valeur.

📖
Begriffe

Wasserstein Distance in DRL

Métrique de distance entre distributions utilisée dans le DRL distributionnel pour mesurer la dissimilarité entre les distributions de retour prédites et cibles, favorisant une meilleure stabilité de l'apprentissage.

📖
Begriffe

Value Distribution Modeling

Technique consistant à approximer la distribution complète des retours attendus pour chaque état-action plutôt que leur seule espérance, capturant l'incertitude et la variabilité inhérentes à l'environnement.

📖
Begriffe

Expectile Regression RL

Variante du DRL distributionnel utilisant la régression expectile plutôt que quantile, offrant une asymétrie contrôlable dans l'estimation de la distribution de retour particulièrement adaptée aux contextes risk-sensibles.

📖
Begriffe

Probabilistic Return Distribution

Représentation probabiliste complète des retours futurs attendus pour chaque paire état-action, caractérisant non seulement la moyenne mais aussi la variance, l'asymétrie et d'autres moments statistiques.

📖
Begriffe

Distributional Projected Bellman Update

Procédure de mise à jour projetant la distribution de retour cible sur l'espace de distributions supportées, assurant la cohérence et la stabilité de l'apprentissage dans le cadre distributionnel.

📖
Begriffe

Tail Risk Assessment in DRL

Capacité du DRL distributionnel à évaluer quantitativement les risques extrêmes (tail risk) en analysant les queues de distribution des retours, crucial pour les applications critiques.

📖
Begriffe

Quantile Sampling Strategies

Techniques d'échantillonnage des quantiles dans le cadre du QR-DRL, incluant l'échantillonnage uniforme, adaptatif ou basé sur l'importance pour optimiser l'efficacité de l'apprentissage de la distribution.

🔍

Keine Ergebnisse gefunden