Méthodes Bootstrap en RL
Bootstrap séquentiel
Variante adaptée aux données temporelles du RL préservant la structure de dépendance séquentielle lors du rééchantillonnage pour éviter la sous-estimation de l'incertitude.
← Назад