🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Distribution de Valeur

Représentation complète de l'incertitude sur les retours futurs dans l'apprentissage par renforcement, modélisant l'ensemble des probabilités de chaque retour possible plutôt que seule son espérance.

📖
термины

Apprentissage par Renforcement Distributionnel

Paradigme de l'AR qui modélise explicitement la distribution complète des retours attendus pour capturer l'incertitude et la variabilité des résultats futurs.

📖
термины

Fonction Q Distributionnelle

Extension de la fonction Q-valeur qui retourne une distribution de probabilité sur les retours attendus au lieu d'une valeur scalaire unique.

📖
термины

Paramétrisation Atomique

Technique de discrétisation des distributions continues en ensembles finis de points (atomes) avec probabilités associées pour faciliter l'apprentissage computationnel.

📖
термины

Categorical Distributional RL (C51)

Algorithme pionnier qui modélise la distribution de retour comme une distribution catégorielle discrète sur un support fixe de valeurs.

📖
термины

Opérateur de Bellman Distributionnel

Généralisation de l'opérateur de Bellman classique qui s'applique aux distributions complètes plutôt qu'aux valeurs espérées uniquement.

📖
термины

Distance de Wasserstein

Métrique utilisée pour mesurer la similarité entre distributions de valeur dans l'espace des retours, permettant de capturer à la fois la localisation et la forme des distributions.

📖
термины

Projection Distributionnelle

Processus de projection de distributions continues sur un support discret prédéfini, essentiel pour l'implémentation pratique des algorithmes distributionnels.

📖
термины

Распределительный риск

Мера неопределенности и изменчивости в предсказаниях вознаграждения, количественно оцениваемая через старшие статистические моменты распределения значений.

📖
термины

Моменты высшего порядка

Статистики (дисперсия, асимметрия, эксцесс), описывающие форму распределения вознаграждения за пределами среднего значения, отражающие асимметрию и концентрацию вероятностей.

📖
термины

Распределительная временная вариация

Временная эволюция полной формы распределения вознаграждения, а не только его ожидаемого значения, выявляющая изменяющиеся паттерны риска.

📖
термины

Дискретное значение поддержки

Конечное и упорядоченное множество значений, на котором непрерывные распределения аппроксимируются в практических распределительных алгоритмах.

📖
термины

Распределительное распространение

Процесс обновления распределений значений через оператор Беллмана, сохраняющий информацию о неопределенности на каждом временном шаге.

📖
термины

Распределительная стабильность

Свойство сходимости распределений значений к стабильной форме во время обучения, обеспечивающее согласованность оценок неопределенности.

🔍

Результаты не найдены