Apprentissage par Prédiction de Trajectoires
Arbre de recherche Monte Carlo
Algorithme d'exploration arborescente utilisant des simulations aléatoires pour évaluer les trajectoires futures possibles depuis un état donné, optimisant la sélection d'actions.
← Zurück