क्यू-लर्निंग
Convergence du Q-learning
Propriété théorique garantissant que les valeurs Q convergent vers les valeurs Q optimales sous certaines conditions, notamment un taux d'apprentissage décroissant et une exploration suffisante.
← पीछे