🏠 홈
벤치마크
📊 모든 벤치마크 🦖 공룡 v1 🦖 공룡 v2 ✅ 할 일 목록 앱 🎨 창의적인 자유 페이지 🎯 FSACB - 궁극의 쇼케이스 🌍 번역 벤치마크
모델
🏆 톱 10 모델 🆓 무료 모델 📋 모든 모델 ⚙️ 킬로 코드 모드
리소스
💬 프롬프트 라이브러리 📖 AI 용어 사전 🔗 유용한 링크

AI 용어집

인공지능 완전 사전

162
카테고리
2,032
하위 카테고리
23,060
용어
📖
용어

Quantile Regression DRL

Approche d'apprentissage par renforcement profond modélisant la distribution complète des retours attendus plutôt que leur seule espérance, utilisant la régression quantile pour estimer les quantiles de la distribution de valeur.

📖
용어

Wasserstein Distance in DRL

Métrique de distance entre distributions utilisée dans le DRL distributionnel pour mesurer la dissimilarité entre les distributions de retour prédites et cibles, favorisant une meilleure stabilité de l'apprentissage.

📖
용어

Value Distribution Modeling

Technique consistant à approximer la distribution complète des retours attendus pour chaque état-action plutôt que leur seule espérance, capturant l'incertitude et la variabilité inhérentes à l'environnement.

📖
용어

Expectile Regression RL

Variante du DRL distributionnel utilisant la régression expectile plutôt que quantile, offrant une asymétrie contrôlable dans l'estimation de la distribution de retour particulièrement adaptée aux contextes risk-sensibles.

📖
용어

Probabilistic Return Distribution

Représentation probabiliste complète des retours futurs attendus pour chaque paire état-action, caractérisant non seulement la moyenne mais aussi la variance, l'asymétrie et d'autres moments statistiques.

📖
용어

Distributional Projected Bellman Update

Procédure de mise à jour projetant la distribution de retour cible sur l'espace de distributions supportées, assurant la cohérence et la stabilité de l'apprentissage dans le cadre distributionnel.

📖
용어

Tail Risk Assessment in DRL

Capacité du DRL distributionnel à évaluer quantitativement les risques extrêmes (tail risk) en analysant les queues de distribution des retours, crucial pour les applications critiques.

📖
용어

Quantile Sampling Strategies

Techniques d'échantillonnage des quantiles dans le cadre du QR-DRL, incluant l'échantillonnage uniforme, adaptatif ou basé sur l'importance pour optimiser l'efficacité de l'apprentissage de la distribution.

🔍

결과를 찾을 수 없습니다