Model-Based Offline RL
Model Ensembling
Technique utilisant plusieurs modèles dynamiques pour capturer différentes hypothèses sur la transition d'état et améliorer la robustesse des prédictions.
← رجوع