MuZero
Self-play
Méthode d'entraînement où MuZero joue contre lui-même pour générer des données d'apprentissage, permettant une amélioration continue sans intervention humaine.
← RetourMéthode d'entraînement où MuZero joue contre lui-même pour générer des données d'apprentissage, permettant une amélioration continue sans intervention humaine.
← Retour