🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles

Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242
catégories
3 353
sous-catégories
40 780
termes
📖
termes

Bootstrap en RL

Technique de rééchantillonnage utilisée en apprentissage par renforcement pour estimer l'incertitude des fonctions de valeur en créant multiple estimations à partir d'un même échantillon de données.

📖
termes

Distribution de valeur Bootstrap

Représentation probabiliste de la fonction de valeur obtenue par agrégation des multiples estimations bootstrap, permettant de quantifier l'incertitude sur les prédictions de valeur.

📖
termes

Bootstrap pondéré

Technique assignant des poids aux échantillons bootstrap basés sur leur pertinence ou récence pour donner plus d'importance aux expériences plus informatives dans l'estimation de valeur.

📖
termes

Q-learning avec Bootstrap

Extension du Q-learning classique utilisant plusieurs têtes Q-value entraînées sur différents échantillons bootstrap pour capturer l'incertitude et améliorer l'exploration.

📖
termes

C51 (Categorical 51)

Algorithme distributional discretisant la distribution des retours en 51 atomes de probabilité, utilisant des techniques bootstrap pour estimer l'incertitude sur cette représentation.

📖
termes

IQN (Implicit Quantile Networks)

Architecture réseau apprenant directement la distribution quantile des retours, intégrant des mécanismes bootstrap pour quantifier l'incertitude des prédictions quantiles.

📖
termes

QR-DQN (Quantile Regression DQN)

Variante du DQN utilisant la régression quantile sur des échantillons bootstrap pour apprendre la distribution complète des valeurs d'action avec quantification d'incertitude.

📖
termes

Réseaux de tête Bootstrap

Architecture comprenant multiples têtes de sortie indépendantes entraînées sur des échantillons bootstrap différents pour capturer l'incertitude dans les prédictions de valeur.

📖
termes

Exploration basée sur l'incertitude

Stratégie d'exploration utilisant les estimations bootstrap pour quantifier l'incertitude et guider l'agent vers les états les moins connus de l'environnement.

📖
termes

Ensembles Bootstrap

Méthode entraînant plusieurs modèles sur différents échantillons bootstrap pour former un ensemble prédictif capturant la variabilité et l'incertitude du processus d'apprentissage.

📖
termes

Dropout comme approximation Bootstrap

Technique utilisant le dropout durant l'inférence comme approximation efficace du bootstrap pour estimer rapidement l'incertitude sans entraîner multiples modèles.

📖
termes

Credible intervals

Intervalles statistiques dérivés des distributions bootstrap quantifiant l'incertitude sur les estimations de valeur avec une probabilité de confiance spécifiée.

📖
termes

Variance Bootstrap

Métrique quantifiant la dispersion des estimations bootstrap entre elles, servant d'indicateur direct de l'incertitude épistémique dans les prédictions de valeur.

📖
termes

Biais Bootstrap

Déviation systématique potentiellement introduite par les méthodes bootstrap, nécessitant des techniques de correction comme le double bootstrap pour des estimations non biaisées.

📖
termes

Bootstrap séquentiel

Variante adaptée aux données temporelles du RL préservant la structure de dépendance séquentielle lors du rééchantillonnage pour éviter la sous-estimation de l'incertitude.

🔍

Aucun résultat trouvé