MuZero
Modèle de valeur
Réseau neuronal dans MuZero qui estime la valeur attendue des états futurs, guidant le processus de planification vers les actions les plus prometteuses.
← RetourRéseau neuronal dans MuZero qui estime la valeur attendue des états futurs, guidant le processus de planification vers les actions les plus prometteuses.
← Retour