Aprendizagem por Reforço Hierárquica Contínua

📖

termos

Aprendizagem por Reforço Hierárquica

Paradigma de aprendizagem onde as políticas de decisão são estruturadas em níveis hierárquicos, permitindo decompor tarefas complexas em subtarefas mais simples e reutilizáveis.

📖

termos

Opções de Sutton

Unidades temporais de ação prolongada que combinam sequências de ações atômicas em comportamentos macroscópicos reutilizáveis, formando a base da abstração temporal na RL hierárquica.

📖

termos

Decomposição de Tarefas

Processo algorítmico de segmentação automática de objetivos complexos em subobjetivos hierarquicamente organizados para facilitar a aprendizagem e a otimização.

📖

termos

Políticas Hierárquicas

Conjunto de políticas de decisão organizadas em camadas onde as políticas de alto nível selecionam subtarefas e as políticas de baixo nível executam as ações correspondentes.

📖

termos

Abstração Temporal

Técnica que agrupa ações primitivas em sequências temporais coerentes, reduzindo a complexidade do planeamento e melhorando a eficiência da aprendizagem.

📖

termos

Meta-Aprendizagem Hierárquica

Abordagem onde o sistema aprende a aprender estruturas hierárquicas ótimas, adaptando-se rapidamente a novas tarefas reutilizando meta-conhecimentos adquiridos.

📖

termos

Consolidação de Pesos

Mecanismo que protege os pesos sinápticos importantes para tarefas anteriores, geralmente através de penalidades regularizadoras, para prevenir o esquecimento durante novas aprendizagens.

📖

termos

Replay Buffer Hierárquico

Estrutura de dados organizada hierarquicamente que armazena e reutiliza seletivamente experiências passadas para manter competências enquanto aprende novas tarefas.

📖

termos

Grafo de Tarefas

Representação formal das dependências e relações entre subtarefas, guiando a construção automática de hierarquias de políticas ótimas.

📖

termos

Transfer Learning Hierárquico

Transferência seletiva de conhecimento entre níveis hierárquicos, permitindo a reutilização de subpolíticas eficazes para acelerar a aprendizagem de novas tarefas complexas.

📖

termos

Estabilização da Aprendizagem Contínua

Conjunto de técnicas algorítmicas que garantem a convergência estável dos modelos durante a aquisição sequencial de competências, evitando oscilações e divergência.

📖

termos

Subpolíticas Reutilizáveis

Módulos de decisão atômicos treinados independentemente que podem ser combinados dinamicamente para formar políticas complexas, promovendo modularidade e eficiência.

📖

termos

Aprendizagem Multi-escalas Temporais

Framework que integra simultaneamente decisões em diferentes horizontes temporais, desde ações imediatas até estratégias de longo prazo, para uma gestão ótima da complexidade.

Glossário IA