🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

Distribution des retours

Représentation probabiliste complète de la somme des récompenses futures actualisées, capturant l'ensemble des scénarios possibles plutôt qu'une seule valeur espérée.

📖
个术语

Distribution quantile

Approche modélisant directement les quantiles de la distribution des retours pour capturer la variabilité et les queues de distribution des récompenses.

📖
个术语

Risque conditionnel à la valeur

Mesure de risque robuste calculant l'espérance des retours dans la queue inférieure de la distribution, au-delà d'un quantile spécifié.

📖
个术语

Distribution implicite

Représentation distributionnelle apprise indirectement sans paramètres explicites, souvent via des réseaux neuronaux génératifs ou des échantillonneurs.

📖
个术语

Variance des retours

Mesure de dispersion quantifiant l'écart quadratique moyen des retours par rapport à leur espérance, indicateur clé du risque dans les décisions.

📖
个术语

Entropie de la politique

Mesure d'incertitude sur les actions de l'agent, utilisée pour explorer l'espace d'états-actions et quantifier l'incertitude comportementale.

📖
个术语

Borne de confiance

Intervalles statistiques garantissant avec une probabilité prédéfinie que la vraie valeur se situe dans la plage estimée, essentiels pour l'exploration sûre.

📖
个术语

Distribution Cramer

Famille de distributions flexibles permettant de modéliser des asymétries et des queues épaisses dans les retours, au-delà des hypothèses gaussiennes.

📖
个术语

Estimation par noyau

Méthode non-paramétrique pour estimer la densité de probabilité des retours en utilisant des fonctions noyau pour lisser les observations empiriques.

📖
个术语

Propagation d'incertitude

Processus de transmission de l'incertitude à travers les étapes successives de l'apprentissage par renforcement, depuis les observations jusqu'aux décisions finales.

📖
个术语

Approximation variationnelle

Méthode d'optimisation approximant les distributions complexes par des familles plus simples, minimisant la divergence entre distributions.

📖
个术语

Distribution mélange

Combination pondérée de plusieurs distributions de base, permettant de capturer des comportements multimodaux dans les retours attendus.

📖
个术语

Fonction de distribution cumulative

Fonction F(x) donnant la probabilité que le retour soit inférieur ou égal à x, caractérisant complètement la distribution des retours.

📖
个术语

Compromis biais-variance

Dilemme fondamental entre la complexité du modèle (variance élevée, biais faible) et sa simplicité (variance faible, biais élevé) dans l'estimation distributionnelle.

🔍

未找到结果