Глоссарий ИИ
Полный словарь искусственного интеллекта
Bootstrap en RL
Technique de rééchantillonnage utilisée en apprentissage par renforcement pour estimer l'incertitude des fonctions de valeur en créant multiple estimations à partir d'un même échantillon de données.
Distribution de valeur Bootstrap
Représentation probabiliste de la fonction de valeur obtenue par agrégation des multiples estimations bootstrap, permettant de quantifier l'incertitude sur les prédictions de valeur.
Bootstrap pondéré
Technique assignant des poids aux échantillons bootstrap basés sur leur pertinence ou récence pour donner plus d'importance aux expériences plus informatives dans l'estimation de valeur.
Q-learning avec Bootstrap
Extension du Q-learning classique utilisant plusieurs têtes Q-value entraînées sur différents échantillons bootstrap pour capturer l'incertitude et améliorer l'exploration.
C51 (Categorical 51)
Algorithme distributional discretisant la distribution des retours en 51 atomes de probabilité, utilisant des techniques bootstrap pour estimer l'incertitude sur cette représentation.
IQN (Implicit Quantile Networks)
Architecture réseau apprenant directement la distribution quantile des retours, intégrant des mécanismes bootstrap pour quantifier l'incertitude des prédictions quantiles.
QR-DQN (Quantile Regression DQN)
Variante du DQN utilisant la régression quantile sur des échantillons bootstrap pour apprendre la distribution complète des valeurs d'action avec quantification d'incertitude.
Réseaux de tête Bootstrap
Architecture comprenant multiples têtes de sortie indépendantes entraînées sur des échantillons bootstrap différents pour capturer l'incertitude dans les prédictions de valeur.
Exploration basée sur l'incertitude
Stratégie d'exploration utilisant les estimations bootstrap pour quantifier l'incertitude et guider l'agent vers les états les moins connus de l'environnement.
Ensembles Bootstrap
Méthode entraînant plusieurs modèles sur différents échantillons bootstrap pour former un ensemble prédictif capturant la variabilité et l'incertitude du processus d'apprentissage.
Dropout comme approximation Bootstrap
Technique utilisant le dropout durant l'inférence comme approximation efficace du bootstrap pour estimer rapidement l'incertitude sans entraîner multiples modèles.
Credible intervals
Intervalles statistiques dérivés des distributions bootstrap quantifiant l'incertitude sur les estimations de valeur avec une probabilité de confiance spécifiée.
Variance Bootstrap
Métrique quantifiant la dispersion des estimations bootstrap entre elles, servant d'indicateur direct de l'incertitude épistémique dans les prédictions de valeur.
Biais Bootstrap
Déviation systématique potentiellement introduite par les méthodes bootstrap, nécessitant des techniques de correction comme le double bootstrap pour des estimations non biaisées.
Bootstrap séquentiel
Variante adaptée aux données temporelles du RL préservant la structure de dépendance séquentielle lors du rééchantillonnage pour éviter la sous-estimation de l'incertitude.