Глоссарий ИИ
Полный словарь искусственного интеллекта
Fonction de Covariance
Fonction noyau définissant la similarité entre points dans un processus gaussien, déterminant la structure de corrélation et les propriétés de lissage du modèle.
GP-MDP
Processus de décision markovien où les récompenses ou transitions sont modélisées par des processus gaussiens, intégrant l'incertitude dans la formulation du problème RL.
Thompson Sampling avec GP
Méthode d'échantillonnage d'actions basée sur des tirages du processus gaussien posterior, permettant l'exploration guidée par l'incertitude.
GP-SARSA
Variante de l'algorithme SARSA utilisant des processus gaussiens pour modéliser la fonction Q-valeur avec incertitude en apprentissage par renforcement.
Kernel RBF
Fonction de base radiale gaussienne utilisée comme covariance dans les GP, assurant la continuité et différentiabilité des fonctions modélisées.
GPQ
Q-fonction approximée par processus gaussien, permettant de quantifier l'incertitude sur les estimations de valeur dans l'apprentissage par renforcement.
GP-PILCO
Framework RL utilisant des processus gaussiens pour apprendre la dynamique du système avec propagation analytique de l'incertitude.
Bandit Contextuel avec GP
Problème de bandit où les récompenses dépendent d'un contexte, modélisé par des processus gaussiens pour capturer l'incertitude spatiale.
GP-MCTS
Monte Carlo Tree Search utilisant des processus gaussiens pour évaluer les nœuds avec incertitude, améliorant la recherche dans RL.
GP-MAE
Maximum a Posteriori avec estimation de l'incertitude par processus gaussiens pour l'estimation de politique en apprentissage par renforcement.