🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📂
подкатегории

Стохастические марковские процессы принятия решений

МПР, в котором переходы и вознаграждения следуют вероятностным распределениям, моделируя неопределенность окружающей среды.

17 термины
📂
подкатегории

Методы Монте-Карло в RL

Алгоритмы, использующие повторную случайную выборку для оценки значений состояние-действие в стохастических средах.

14 термины
📂
подкатегории

Politiques Stochastiques

Stratégies retournant des distributions de probabilités sur les actions plutôt que des actions déterministes.

11 термины
📂
подкатегории

Apprentissage par Renforcement Bayésien

Approche traitant l'incertitude sur les paramètres du modèle en utilisant des distributions de probabilité.

9 термины
📂
подкатегории

Bandits Stochastiques Multi-bras

Problème d'exploration-exploitation où chaque bras a une distribution de récompense stochastique inconnue.

7 термины
📂
подкатегории

Méthodes Bootstrap en RL

Techniques utilisant le rééchantillonnage pour quantifier l'incertitude dans les estimations de valeur.

15 термины
📂
подкатегории

Processus Gaussiens pour RL

Utilisation de processus gaussiens pour modéliser l'incertitude dans la fonction de valeur ou de transition.

10 термины
📂
подкатегории

Méthodes d'Ensemble en RL Stochastique

Combinaison de multiples estimateurs pour capturer l'incertitude épistémique dans l'apprentissage.

19 термины
📂
подкатегории

Distributional Reinforcement Learning

Apprentissage de la distribution complète des retours plutôt que seulement leur espérance mathématique.

5 термины
📂
подкатегории

Quantile Regression DRL

Approche spécifique du distributional RL utilisant la régression quantile pour modéliser l'incertitude.

8 термины
📂
подкатегории

MDP Partiellement Observables Stochastiques

Extension des MDP stochastiques avec observation partielle, augmentant l'incertitude sur l'état.

8 термины
📂
подкатегории

Optimisation Stochastique en RL

Méthodes d'optimisation tenant compte du bruit et de l'incertitude dans les gradients et mises à jour.

10 термины
🔍

Результаты не найдены