एआई शब्दावली

आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश

179

श्रेणियाँ

1,183

उप-श्रेणियाँ

14,904

शब्द

📂

उप-श्रेणियाँ

Processus de Décision Markoviens Stochastiques

MDP où les transitions et récompenses suivent des distributions probabilistes, modélisant l'incertitude environnementale.

17 शब्द

📂

उप-श्रेणियाँ

Méthodes Monte Carlo en RL

Algorithmes utilisant l'échantillonnage aléatoire répété pour estimer les valeurs d'état-action dans des environnements stochastiques.

14 शब्द

📂

उप-श्रेणियाँ

Politiques Stochastiques

Stratégies retournant des distributions de probabilités sur les actions plutôt que des actions déterministes.

11 शब्द

📂

उप-श्रेणियाँ

Apprentissage par Renforcement Bayésien

Approche traitant l'incertitude sur les paramètres du modèle en utilisant des distributions de probabilité.

9 शब्द

📂

उप-श्रेणियाँ

Bandits Stochastiques Multi-bras

Problème d'exploration-exploitation où chaque bras a une distribution de récompense stochastique inconnue.

7 शब्द

📂

उप-श्रेणियाँ

Méthodes Bootstrap en RL

Techniques utilisant le rééchantillonnage pour quantifier l'incertitude dans les estimations de valeur.

15 शब्द

📂

उप-श्रेणियाँ

Processus Gaussiens pour RL

Utilisation de processus gaussiens pour modéliser l'incertitude dans la fonction de valeur ou de transition.

10 शब्द

📂

उप-श्रेणियाँ

Méthodes d'Ensemble en RL Stochastique

Combinaison de multiples estimateurs pour capturer l'incertitude épistémique dans l'apprentissage.

19 शब्द

📂

उप-श्रेणियाँ

Distributional Reinforcement Learning

Apprentissage de la distribution complète des retours plutôt que seulement leur espérance mathématique.

5 शब्द

📂

उप-श्रेणियाँ

Quantile Regression DRL

Approche spécifique du distributional RL utilisant la régression quantile pour modéliser l'incertitude.

8 शब्द

📂

उप-श्रेणियाँ

MDP Partiellement Observables Stochastiques

Extension des MDP stochastiques avec observation partielle, augmentant l'incertitude sur l'état.

8 शब्द

📂

उप-श्रेणियाँ

Optimisation Stochastique en RL

Méthodes d'optimisation tenant compte du bruit et de l'incertitude dans les gradients et mises à jour.

10 शब्द

🔍

एआई शब्दावली

Processus de Décision Markoviens Stochastiques

Méthodes Monte Carlo en RL

Politiques Stochastiques

Apprentissage par Renforcement Bayésien

Bandits Stochastiques Multi-bras

Méthodes Bootstrap en RL

Processus Gaussiens pour RL

Méthodes d'Ensemble en RL Stochastique

Distributional Reinforcement Learning

Quantile Regression DRL

MDP Partiellement Observables Stochastiques

Optimisation Stochastique en RL

कोई परिणाम नहीं मिला