Иерархическое обучение с подкреплением

📂

подкатегории

Опции Саттона

Фундаментальная концепция, введенная Саттоном, определяющая временные расширенные действия с собственными политиками, условиями входа и функциями завершения.

15 термины

📂

подкатегории

MAXQ Декомпозиция

Иерархический подход декомпозиции, основанный на задачах, который структурирует проблемы в графы подзадач с распределением ценности.

15 термины

📂

подкатегории

HAM (Иерархические Абстрактные Машины)

Иерархические конечные автоматы, определяющие абстрактные политики и подполитики для управления обучением.

15 термины

📂

подкатегории

FeUdal Networks

Архитектура, вдохновленная феодализмом, с менеджерами, определяющими цели, и работниками, выполняющими низкоуровневые действия.

8 термины

📂

подкатегории

Целеориентированное обучение с подкреплением

Обучение с подкреплением, где политики обусловлены подцелями для облегчения иерархической декомпозиции.

15 термины

📂

подкатегории

Открытие подцелей

Автоматические методы для выявления и обнаружения релевантных подцелей в пространстве состояний без человеческого контроля.

18 термины

📂

подкатегории

Временная абстракция

Методы, позволяющие абстрагировать решения на различных временных масштабах для управления длительными временными горизонтами.

19 термины

📂

подкатегории

Многозадачное HRL

Иерархическое обучение одновременно нескольким задачам, разделяющим общие подзадачи для эффективного переноса.

14 термины

📂

подкатегории

Внутренняя мотивация в HRL

Использование внутренних вознаграждений для автоматического обнаружения релевантных иерархических структур.

13 термины

📂

подкатегории

Метаобучение в HRL

Метаобученческие подходы для автоматической адаптации иерархических структур к новым задачам и средам.

13 термины

📂

подкатегории

Методы обнаружения опций

Специфические алгоритмы для автоматического обнаружения эффективных опций на основе плотности, достижимости или узких мест.

14 термины

📂

подкатегории

Иерархический градиент политики

Методы градиента политики, адаптированные к иерархическим структурам с одновременной оптимизацией иерархических уровней.

10 термины

📂

подкатегории

Абстракция состояния в HRL

Методы абстракции состояния для упрощения представлений на различных иерархических уровнях и ускорения обучения.

12 термины

📂

подкатегории

Функции завершения

Функции, определяющие момент завершения опций и подзадач, ключевые для эффективности иерархий.

15 термины

📂

подкатегории

Иерархический Актор-Критик

Архитектура актор-критик с многоуровневыми акторами и критиками, скоординированными для иерархического обучения.

12 термины

Глоссарий ИИ

Опции Саттона

MAXQ Декомпозиция

HAM (Иерархические Абстрактные Машины)

FeUdal Networks

Целеориентированное обучение с подкреплением

Открытие подцелей

Временная абстракция

Многозадачное HRL

Внутренняя мотивация в HRL

Метаобучение в HRL

Методы обнаружения опций

Иерархический градиент политики

Абстракция состояния в HRL

Функции завершения

Иерархический Актор-Критик

Результаты не найдены