Glossário IA
O dicionário completo da Inteligência Artificial
Opções de Sutton
Conceito fundamental introduzido por Sutton que define ações temporárias estendidas com políticas próprias, condições de entrada e funções de terminação.
Decomposição MAXQ
Abordagem de decomposição hierárquica baseada em tarefas que estrutura problemas em grafos de subtarefas com alocação de valor.
HAM (Máquinas Abstratas Hierárquicas)
Máquinas de estados finitos hierárquicas que definem políticas abstratas e subpolíticas para guiar a aprendizagem.
Redes FeUdais
Arquitetura inspirada no feudalismo com gerentes que definem objetivos e trabalhadores que executam as ações de baixo nível.
Aprendizagem por Reforço Condicionada a Objetivos
Aprendizagem por reforço onde as políticas são condicionadas por sub-objetivos para facilitar a decomposição hierárquica.
Descoberta de Submetas
Técnicas automáticas para identificar e descobrir submetas relevantes no espaço de estados sem supervisão humana.
Abstração Temporal
Métodos para abstrair decisões em diferentes escalas de tempo para gerenciar horizontes temporais longos.
HRL multi-tarefa
Aprendizagem hierárquica simultânea em múltiplas tarefas que partilham subtarefas comuns para uma transferência eficiente.
Motivação Intrínseca em HRL
Utilização de recompensas intrínsecas para guiar a descoberta automática de estruturas hierárquicas relevantes.
Meta-aprendizagem em HRL
Abordagens de meta-aprendizagem para adaptar automaticamente estruturas hierárquicas a novas tarefas e ambientes.
Métodos de Descoberta de Opções
Algoritmos específicos para descobrir automaticamente opções eficazes baseadas na densidade, alcançabilidade ou gargalo.
Gradiente de Política Hierárquico
Métodos de gradiente de política adaptados a estruturas hierárquicas com otimização simultânea dos níveis hierárquicos.
Abstração de Estado em HRL
Técnicas de abstração de estado para simplificar as representações em diferentes níveis hierárquicos e acelerar a aprendizagem.
Funções de Terminação
Funções que decidem quando terminar as opções e subtarefas, cruciais para a eficiência das hierarquias.
Ator-Crítico Hierárquico
Arquitetura ator-crítico com atores e críticos multiníveis coordenados para aprendizagem hierárquica.