মডেল-ভিত্তিক গভীর RL
Model-Based Value Expansion (MVE)
Technique utilisant le modèle pour extrapoler les retours au-delà de l'horizon réel, combinant données réelles et simulées pour estimer plus précisément les valeurs à long terme.
← ফিরে যান