🏠 Ana Sayfa
Benchmarklar
📊 Tüm Benchmarklar 🦖 Dinozor v1 🦖 Dinozor v2 ✅ To-Do List Uygulamaları 🎨 Yaratıcı Serbest Sayfalar 🎯 FSACB - Nihai Gösteri 🌍 Çeviri Benchmarkı
Modeller
🏆 En İyi 10 Model 🆓 Ücretsiz Modeller 📋 Tüm Modeller ⚙️ Kilo Code
Kaynaklar
💬 Prompt Kütüphanesi 📖 YZ Sözlüğü 🔗 Faydalı Bağlantılar

YZ Sözlüğü

Yapay Zekanın tam sözlüğü

162
kategoriler
2.032
alt kategoriler
23.060
terimler
📖
terimler

Quantile Regression DRL

Approche d'apprentissage par renforcement profond modélisant la distribution complète des retours attendus plutôt que leur seule espérance, utilisant la régression quantile pour estimer les quantiles de la distribution de valeur.

📖
terimler

Wasserstein Distance in DRL

Métrique de distance entre distributions utilisée dans le DRL distributionnel pour mesurer la dissimilarité entre les distributions de retour prédites et cibles, favorisant une meilleure stabilité de l'apprentissage.

📖
terimler

Value Distribution Modeling

Technique consistant à approximer la distribution complète des retours attendus pour chaque état-action plutôt que leur seule espérance, capturant l'incertitude et la variabilité inhérentes à l'environnement.

📖
terimler

Expectile Regression RL

Variante du DRL distributionnel utilisant la régression expectile plutôt que quantile, offrant une asymétrie contrôlable dans l'estimation de la distribution de retour particulièrement adaptée aux contextes risk-sensibles.

📖
terimler

Probabilistic Return Distribution

Représentation probabiliste complète des retours futurs attendus pour chaque paire état-action, caractérisant non seulement la moyenne mais aussi la variance, l'asymétrie et d'autres moments statistiques.

📖
terimler

Distributional Projected Bellman Update

Procédure de mise à jour projetant la distribution de retour cible sur l'espace de distributions supportées, assurant la cohérence et la stabilité de l'apprentissage dans le cadre distributionnel.

📖
terimler

Tail Risk Assessment in DRL

Capacité du DRL distributionnel à évaluer quantitativement les risques extrêmes (tail risk) en analysant les queues de distribution des retours, crucial pour les applications critiques.

📖
terimler

Quantile Sampling Strategies

Techniques d'échantillonnage des quantiles dans le cadre du QR-DRL, incluant l'échantillonnage uniforme, adaptatif ou basé sur l'importance pour optimiser l'efficacité de l'apprentissage de la distribution.

🔍

Sonuç bulunamadı