Apprentissage par Ensemble de Modèles
Variance d'Ensemble
Métrique quantifiant la dispersion des prédictions entre les différents modèles d'un ensemble, servant de proxy direct pour l'incertitude épistémique dans les systèmes Model-Based RL. Plus élevée dans les régions peu explorées de l'espace d'états.
← 返回