Glossário IA
O dicionário completo da Inteligência Artificial
Aprendizagem por Reforço Hierárquica
Paradigma de aprendizagem onde as políticas de decisão são estruturadas em níveis hierárquicos, permitindo decompor tarefas complexas em subtarefas mais simples e reutilizáveis.
Opções de Sutton
Unidades temporais de ação prolongada que combinam sequências de ações atômicas em comportamentos macroscópicos reutilizáveis, formando a base da abstração temporal na RL hierárquica.
Decomposição de Tarefas
Processo algorítmico de segmentação automática de objetivos complexos em subobjetivos hierarquicamente organizados para facilitar a aprendizagem e a otimização.
Políticas Hierárquicas
Conjunto de políticas de decisão organizadas em camadas onde as políticas de alto nível selecionam subtarefas e as políticas de baixo nível executam as ações correspondentes.
Abstração Temporal
Técnica que agrupa ações primitivas em sequências temporais coerentes, reduzindo a complexidade do planeamento e melhorando a eficiência da aprendizagem.
Meta-Aprendizagem Hierárquica
Abordagem onde o sistema aprende a aprender estruturas hierárquicas ótimas, adaptando-se rapidamente a novas tarefas reutilizando meta-conhecimentos adquiridos.
Consolidação de Pesos
Mecanismo que protege os pesos sinápticos importantes para tarefas anteriores, geralmente através de penalidades regularizadoras, para prevenir o esquecimento durante novas aprendizagens.
Replay Buffer Hierárquico
Estrutura de dados organizada hierarquicamente que armazena e reutiliza seletivamente experiências passadas para manter competências enquanto aprende novas tarefas.
Grafo de Tarefas
Representação formal das dependências e relações entre subtarefas, guiando a construção automática de hierarquias de políticas ótimas.
Transfer Learning Hierárquico
Transferência seletiva de conhecimento entre níveis hierárquicos, permitindo a reutilização de subpolíticas eficazes para acelerar a aprendizagem de novas tarefas complexas.
Estabilização da Aprendizagem Contínua
Conjunto de técnicas algorítmicas que garantem a convergência estável dos modelos durante a aquisição sequencial de competências, evitando oscilações e divergência.
Subpolíticas Reutilizáveis
Módulos de decisão atômicos treinados independentemente que podem ser combinados dinamicamente para formar políticas complexas, promovendo modularidade e eficiência.
Aprendizagem Multi-escalas Temporais
Framework que integra simultaneamente decisões em diferentes horizontes temporais, desde ações imediatas até estratégias de longo prazo, para uma gestão ótima da complexidade.