Éligibility Traces
Q(λ) Learning
Extension off-policy de Q-learning utilisant les eligibility traces pour accélérer la convergence vers la politique optimale en environnement partiellement observable.
← Kembali