Глоссарий ИИ

Полный словарь искусственного интеллекта

235

категории

2 988

подкатегории

33 628

термины

📂

подкатегории

Стохастические марковские процессы принятия решений

МПР, в котором переходы и вознаграждения следуют вероятностным распределениям, моделируя неопределенность окружающей среды.

17 термины

📂

подкатегории

Методы Монте-Карло в RL

Алгоритмы, использующие повторную случайную выборку для оценки значений состояние-действие в стохастических средах.

14 термины

📂

подкатегории

Politiques Stochastiques

Stratégies retournant des distributions de probabilités sur les actions plutôt que des actions déterministes.

11 термины

📂

подкатегории

Apprentissage par Renforcement Bayésien

Approche traitant l'incertitude sur les paramètres du modèle en utilisant des distributions de probabilité.

9 термины

📂

подкатегории

Bandits Stochastiques Multi-bras

Problème d'exploration-exploitation où chaque bras a une distribution de récompense stochastique inconnue.

7 термины

📂

подкатегории

Méthodes Bootstrap en RL

Techniques utilisant le rééchantillonnage pour quantifier l'incertitude dans les estimations de valeur.

15 термины

📂

подкатегории

Processus Gaussiens pour RL

Utilisation de processus gaussiens pour modéliser l'incertitude dans la fonction de valeur ou de transition.

10 термины

📂

подкатегории

Méthodes d'Ensemble en RL Stochastique

Combinaison de multiples estimateurs pour capturer l'incertitude épistémique dans l'apprentissage.

19 термины

📂

подкатегории

Distributional Reinforcement Learning

Apprentissage de la distribution complète des retours plutôt que seulement leur espérance mathématique.

5 термины

📂

подкатегории

Quantile Regression DRL

Approche spécifique du distributional RL utilisant la régression quantile pour modéliser l'incertitude.

8 термины

📂

подкатегории

MDP Partiellement Observables Stochastiques

Extension des MDP stochastiques avec observation partielle, augmentant l'incertitude sur l'état.

8 термины

📂

подкатегории

Optimisation Stochastique en RL

Méthodes d'optimisation tenant compte du bruit et de l'incertitude dans les gradients et mises à jour.

10 термины

🔍

Глоссарий ИИ

Стохастические марковские процессы принятия решений

Методы Монте-Карло в RL

Politiques Stochastiques

Apprentissage par Renforcement Bayésien

Bandits Stochastiques Multi-bras

Méthodes Bootstrap en RL

Processus Gaussiens pour RL

Méthodes d'Ensemble en RL Stochastique

Distributional Reinforcement Learning

Quantile Regression DRL

MDP Partiellement Observables Stochastiques

Optimisation Stochastique en RL

Результаты не найдены