Hierarchical Reinforcement Learning

📂

sottocategorie

Sutton Options

Fundamental concept introduced by Sutton defining extended temporal actions with their own policies, entry conditions, and termination functions.

15 termini

📂

sottocategorie

MAXQ Decomposition

Hierarchical decomposition approach based on tasks that structures problems into subtask graphs with value decomposition.

15 termini

📂

sottocategorie

HAM (Hierarchical Abstract Machines)

Hierarchical finite state machines that define abstract policies and sub-policies to guide learning.

15 termini

📂

sottocategorie

FeUdal Networks

Feudal-inspired architecture with managers that define objectives and workers that execute low-level actions.

8 termini

📂

sottocategorie

Goal-Conditioned RL

Reinforcement learning where policies are conditioned by sub-goals to facilitate hierarchical decomposition.

15 termini

📂

sottocategorie

Subgoal Discovery

Automatic techniques for identifying and discovering relevant subgoals in the state space without human supervision.

18 termini

📂

sottocategorie

Temporal Abstraction

Methods for abstracting decisions across different time scales to manage long temporal horizons.

19 termini

📂

sottocategorie

Multi-task HRL

Simultaneous hierarchical learning on multiple tasks sharing common subtasks for efficient transfer.

14 termini

📂

sottocategorie

Intrinsic Motivation in HRL

Use of intrinsic rewards to guide the automatic discovery of relevant hierarchical structures.

13 termini

📂

sottocategorie

Meta-learning in HRL

Meta-learning approaches to automatically adapt hierarchical structures to new tasks and environments.

13 termini

📂

sottocategorie

Option Discovery Methods

Specific algorithms for automatically discovering effective options based on density, reachability, or bottleneck.

14 termini

📂

sottocategorie

Hierarchical Policy Gradient

Methods of policy gradient adapted to hierarchical structures with simultaneous optimization of hierarchical levels.

10 termini

📂

sottocategorie

State Abstraction in HRL

State abstraction techniques to simplify representations at different hierarchical levels and accelerate learning.

12 termini

📂

sottocategorie

Termination Functions

Functions deciding when to terminate options and subtasks, crucial for the efficiency of hierarchies.

15 termini

📂

sottocategorie

Hierarchical Actor-Critic

Hierarchical actor-critic architecture with coordinated multi-level actors and critics for hierarchical learning.

12 termini

Glossario IA

Sutton Options

MAXQ Decomposition

HAM (Hierarchical Abstract Machines)

FeUdal Networks

Goal-Conditioned RL

Subgoal Discovery

Temporal Abstraction

Multi-task HRL

Intrinsic Motivation in HRL

Meta-learning in HRL

Option Discovery Methods

Hierarchical Policy Gradient

State Abstraction in HRL

Termination Functions

Hierarchical Actor-Critic

Nessun risultato trovato