MuZero
Modèle de valeur
Réseau neuronal dans MuZero qui estime la valeur attendue des états futurs, guidant le processus de planification vers les actions les plus prometteuses.
← KembaliRéseau neuronal dans MuZero qui estime la valeur attendue des états futurs, guidant le processus de planification vers les actions les plus prometteuses.
← Kembali