🏠 होम
बेंचमार्क
📊 सभी बेंचमार्क 🦖 डायनासोर v1 🦖 डायनासोर v2 ✅ टू-डू लिस्ट ऐप्स 🎨 रचनात्मक फ्री पेज 🎯 FSACB - अल्टीमेट शोकेस 🌍 अनुवाद बेंचमार्क
मॉडल
🏆 टॉप 10 मॉडल 🆓 मुफ्त मॉडल 📋 सभी मॉडल ⚙️ किलो कोड
संसाधन
💬 प्रॉम्प्ट लाइब्रेरी 📖 एआई शब्दावली 🔗 उपयोगी लिंक

एआई शब्दावली

आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश

179
श्रेणियाँ
1,183
उप-श्रेणियाँ
14,904
शब्द
📂
उप-श्रेणियाँ

Processus de Décision Markoviens Stochastiques

MDP où les transitions et récompenses suivent des distributions probabilistes, modélisant l'incertitude environnementale.

17 शब्द
📂
उप-श्रेणियाँ

Méthodes Monte Carlo en RL

Algorithmes utilisant l'échantillonnage aléatoire répété pour estimer les valeurs d'état-action dans des environnements stochastiques.

14 शब्द
📂
उप-श्रेणियाँ

Politiques Stochastiques

Stratégies retournant des distributions de probabilités sur les actions plutôt que des actions déterministes.

11 शब्द
📂
उप-श्रेणियाँ

Apprentissage par Renforcement Bayésien

Approche traitant l'incertitude sur les paramètres du modèle en utilisant des distributions de probabilité.

9 शब्द
📂
उप-श्रेणियाँ

Bandits Stochastiques Multi-bras

Problème d'exploration-exploitation où chaque bras a une distribution de récompense stochastique inconnue.

7 शब्द
📂
उप-श्रेणियाँ

Méthodes Bootstrap en RL

Techniques utilisant le rééchantillonnage pour quantifier l'incertitude dans les estimations de valeur.

15 शब्द
📂
उप-श्रेणियाँ

Processus Gaussiens pour RL

Utilisation de processus gaussiens pour modéliser l'incertitude dans la fonction de valeur ou de transition.

10 शब्द
📂
उप-श्रेणियाँ

Méthodes d'Ensemble en RL Stochastique

Combinaison de multiples estimateurs pour capturer l'incertitude épistémique dans l'apprentissage.

19 शब्द
📂
उप-श्रेणियाँ

Distributional Reinforcement Learning

Apprentissage de la distribution complète des retours plutôt que seulement leur espérance mathématique.

5 शब्द
📂
उप-श्रेणियाँ

Quantile Regression DRL

Approche spécifique du distributional RL utilisant la régression quantile pour modéliser l'incertitude.

8 शब्द
📂
उप-श्रेणियाँ

MDP Partiellement Observables Stochastiques

Extension des MDP stochastiques avec observation partielle, augmentant l'incertitude sur l'état.

8 शब्द
📂
उप-श्रेणियाँ

Optimisation Stochastique en RL

Méthodes d'optimisation tenant compte du bruit et de l'incertitude dans les gradients et mises à jour.

10 शब्द
🔍

कोई परिणाम नहीं मिला