Q-learning
Taux d'apprentissage alpha
Paramètre α ∈ [0,1] contrôlant l'importance des nouvelles informations dans la mise à jour des valeurs Q, déterminant la vitesse de convergence de l'algorithme.
← Zurück