Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Ensemble de Modèles
Approche consistant à entraîner plusieurs modèles de prédiction simultanément pour combiner leurs prédictions et réduire l'erreur de généralisation. Cette technique permet d'améliorer la robustesse et d'estimer l'incertitude épistémique dans les systèmes d'apprentissage par renforcement.
Bootstrap d'Ensembles
Méthode d'échantillonnage avec remise utilisée pour créer des ensembles de données d'entraînement variés, permettant d'entraîner plusieurs modèles sur des sous-ensembles différents pour capturer la variabilité des prédictions. Particulièrement efficace pour l'estimation de l'incertitude en Model-Based RL.
Prédiction d'Ensemble
Technique agrégeant les prédictions de plusieurs modèles formant un ensemble, typiquement par moyennage ou vote, pour obtenir une prédiction finale plus stable et plus précise. La variance entre les prédictions individuelles quantifie l'incertitude du modèle.
Robustesse de Décision
Capacité d'un agent à maintenir des performances acceptables face aux incertitudes du modèle et aux variations de l'environnement, en utilisant des ensembles pour évaluer la confiance des décisions. Critique pour le déploiement d'agents RL dans des environnements réels.
Moyennage d'Ensemble
Méthode d'agrégation où la prédiction finale est la moyenne des prédictions individuelles de chaque modèle de l'ensemble, réduisant le biais et la variance tout en fournissant une mesure naturelle d'incertitude. Foundation des approches modernes d'ensemble en RL.
Ponderation d'Incertitude
Stratégie utilisant l'incertitude estimée par les ensembles pour pondérer les décisions, favorisant les actions avec des prédictions plus certaines pendant l'exploitation et explorant les zones à haute incertitude. Améliore l'équilibre exploration-exploitation en RL.
Exploration dirigée par l'incertitude
Politique d'exploration utilisant les mesures d'incertitude des ensembles pour guider l'agent vers des états peu connus, optimisant la collecte d'informations pour améliorer l'apprentissage du modèle. Alternative efficace aux méthodes d'exploration basées sur la curiosité.
Bayésien Approximatif
Approximation de l'inférence bayésienne exacte utilisant des ensembles de réseaux neuronaux pour estimer la distribution postérieure des paramètres du modèle. Fournit une interprétation probabiliste pratique pour la quantification d'incertitude en RL.
Incertitude Aléatoire
Incertitude inhérente au processus, irréductible même avec des données infinies, résultant du bruit stochastique dans l'environnement ou les observations. Différenciée de l'incertitude épistémique dans les approches modernes de quantification.
Variance d'Ensemble
Métrique quantifiant la dispersion des prédictions entre les différents modèles d'un ensemble, servant de proxy direct pour l'incertitude épistémique dans les systèmes Model-Based RL. Plus élevée dans les régions peu explorées de l'espace d'états.
Distribution Postérieure Predictive
Distribution complète sur les états futurs ou récompenses intégrant à la fois l'incertitude sur les paramètres du modèle et le bruit du processus, approximée par les prédictions d'ensemble en pratique. Fondamentale pour la planification robuste en RL.
Efficacité Échantillonnale
Mesure de la capacité d'un algorithme à apprendre avec un minimum d'interactions avec l'environnement, améliorée par les ensembles qui permettent un transfert efficace de connaissances et une exploration ciblée. Critique pour les applications RL coûteuses en données.
Généralisation par Ensemble
Capacité des méthodes d'ensemble à mieux généraliser à des états non vus en combinant les connaissances de plusieurs modèles partiellement corrects, réduisant le surapprentissage et améliorant la robustesse aux variations de distribution.
Hyperparamètres d'Ensemble
Paramètres contrôlant la configuration de l'ensemble, incluant le nombre de modèles, les taux de bootstrap, les méthodes d'agrégation et les stratégies de diversification. Cruciaux pour optimiser le compromis entre performance et complexité computationnelle.