Глоссарий ИИ
Полный словарь искусственного интеллекта
Дистрибутивные функции ценности
Моделирование функций ценности как полных распределений, а не скаляров.
Категориальный DQN
Алгоритм, использующий дискретное категориальное представление распределения вознаграждений.
Регрессионная квантильная DQN
Подход с использованием квантильной регрессии для прямого обучения квантилей распределения.
Обучение с учетом риска
Использование полных распределений для моделирования предпочтений при риске
Дистрибутивный градиент политики
Расширение методов градиента политики на дистрибутивные подходы
Оценка неопределенности
Количественная оценка неопределенности в прогнозах через распределение доходов.
Многошаговое распределительное обучение с подкреплением
Расширение многошаговых методов до распределительной основы для большей стабильности
Непрерывное дистрибутивное обучение с подкреплением
Применение дистрибутивных методов к непрерывным пространствам действий
Дистрибутивный Актор-Критик
Комбинация дистрибутивных подходов с методами актор-критик.
RL, основанный на дистрибутивной модели
Интеграция дистрибутивов в методах обучения с подкреплением, основанных на модели.
Дистрибутивное иерархическое обучение с подкреплением
Применение дистрибутивных концепций к иерархическим структурам принятия решений
Дистрибутивный перенос обучения
Использование распределений для улучшения переноса знаний между задачами