Méthodes Bootstrap en RL
Q-learning avec Bootstrap
Extension du Q-learning classique utilisant plusieurs têtes Q-value entraînées sur différents échantillons bootstrap pour capturer l'incertitude et améliorer l'exploration.
← Retour