Глоссарий ИИ
Полный словарь искусственного интеллекта
Опции Саттона
Фундаментальная концепция, введенная Саттоном, определяющая временные расширенные действия с собственными политиками, условиями входа и функциями завершения.
MAXQ Декомпозиция
Иерархический подход декомпозиции, основанный на задачах, который структурирует проблемы в графы подзадач с распределением ценности.
HAM (Иерархические Абстрактные Машины)
Иерархические конечные автоматы, определяющие абстрактные политики и подполитики для управления обучением.
FeUdal Networks
Архитектура, вдохновленная феодализмом, с менеджерами, определяющими цели, и работниками, выполняющими низкоуровневые действия.
Целеориентированное обучение с подкреплением
Обучение с подкреплением, где политики обусловлены подцелями для облегчения иерархической декомпозиции.
Открытие подцелей
Автоматические методы для выявления и обнаружения релевантных подцелей в пространстве состояний без человеческого контроля.
Временная абстракция
Методы, позволяющие абстрагировать решения на различных временных масштабах для управления длительными временными горизонтами.
Многозадачное HRL
Иерархическое обучение одновременно нескольким задачам, разделяющим общие подзадачи для эффективного переноса.
Внутренняя мотивация в HRL
Использование внутренних вознаграждений для автоматического обнаружения релевантных иерархических структур.
Метаобучение в HRL
Метаобученческие подходы для автоматической адаптации иерархических структур к новым задачам и средам.
Методы обнаружения опций
Специфические алгоритмы для автоматического обнаружения эффективных опций на основе плотности, достижимости или узких мест.
Иерархический градиент политики
Методы градиента политики, адаптированные к иерархическим структурам с одновременной оптимизацией иерархических уровней.
Абстракция состояния в HRL
Методы абстракции состояния для упрощения представлений на различных иерархических уровнях и ускорения обучения.
Функции завершения
Функции, определяющие момент завершения опций и подзадач, ключевые для эффективности иерархий.
Иерархический Актор-Критик
Архитектура актор-критик с многоуровневыми акторами и критиками, скоординированными для иерархического обучения.