Model-Based Offline RL
Ensemble Models
Collection de plusieurs modèles dynamiques entraînés avec différentes initialisations pour estimer l'incertitude épistémique par la variance des prédictions.
← رجوع