एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
Processus de Décision Markoviens Stochastiques
MDP où les transitions et récompenses suivent des distributions probabilistes, modélisant l'incertitude environnementale.
Méthodes Monte Carlo en RL
Algorithmes utilisant l'échantillonnage aléatoire répété pour estimer les valeurs d'état-action dans des environnements stochastiques.
Politiques Stochastiques
Stratégies retournant des distributions de probabilités sur les actions plutôt que des actions déterministes.
Apprentissage par Renforcement Bayésien
Approche traitant l'incertitude sur les paramètres du modèle en utilisant des distributions de probabilité.
Bandits Stochastiques Multi-bras
Problème d'exploration-exploitation où chaque bras a une distribution de récompense stochastique inconnue.
Méthodes Bootstrap en RL
Techniques utilisant le rééchantillonnage pour quantifier l'incertitude dans les estimations de valeur.
Processus Gaussiens pour RL
Utilisation de processus gaussiens pour modéliser l'incertitude dans la fonction de valeur ou de transition.
Méthodes d'Ensemble en RL Stochastique
Combinaison de multiples estimateurs pour capturer l'incertitude épistémique dans l'apprentissage.
Distributional Reinforcement Learning
Apprentissage de la distribution complète des retours plutôt que seulement leur espérance mathématique.
Quantile Regression DRL
Approche spécifique du distributional RL utilisant la régression quantile pour modéliser l'incertitude.
MDP Partiellement Observables Stochastiques
Extension des MDP stochastiques avec observation partielle, augmentant l'incertitude sur l'état.
Optimisation Stochastique en RL
Méthodes d'optimisation tenant compte du bruit et de l'incertitude dans les gradients et mises à jour.