🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📂
подкатегории

Дистрибутивные функции ценности

Моделирование функций ценности как полных распределений, а не скаляров.

14 термины
📂
подкатегории

Категориальный DQN

Алгоритм, использующий дискретное категориальное представление распределения вознаграждений.

14 термины
📂
подкатегории

Регрессионная квантильная DQN

Подход с использованием квантильной регрессии для прямого обучения квантилей распределения.

10 термины
📂
подкатегории

Обучение с учетом риска

Использование полных распределений для моделирования предпочтений при риске

7 термины
📂
подкатегории

Дистрибутивный градиент политики

Расширение методов градиента политики на дистрибутивные подходы

10 термины
📂
подкатегории

Оценка неопределенности

Количественная оценка неопределенности в прогнозах через распределение доходов.

14 термины
📂
подкатегории

Многошаговое распределительное обучение с подкреплением

Расширение многошаговых методов до распределительной основы для большей стабильности

15 термины
📂
подкатегории

Непрерывное дистрибутивное обучение с подкреплением

Применение дистрибутивных методов к непрерывным пространствам действий

19 термины
📂
подкатегории

Дистрибутивный Актор-Критик

Комбинация дистрибутивных подходов с методами актор-критик.

16 термины
📂
подкатегории

RL, основанный на дистрибутивной модели

Интеграция дистрибутивов в методах обучения с подкреплением, основанных на модели.

17 термины
📂
подкатегории

Дистрибутивное иерархическое обучение с подкреплением

Применение дистрибутивных концепций к иерархическим структурам принятия решений

11 термины
📂
подкатегории

Дистрибутивный перенос обучения

Использование распределений для улучшения переноса знаний между задачами

9 термины
🔍

Результаты не найдены