Glossário IA
O dicionário completo da Inteligência Artificial
Política de Planejamento (Planning Policy)
Função ou estratégia que mapeia cada estado do ambiente para uma ação específica, definindo o comportamento do agente para atingir objetivos de planejamento ótimos.
Modelagem de Recompensa (Reward Shaping)
Técnica de design de recompensas que modifica a função de recompensa original para guiar mais eficazmente o agente em direção a comportamentos de planejamento desejáveis.
Planejamento Hierárquico por RL (Hierarchical RL Planning)
Abordagem onde a política de planejamento é decomposta em uma hierarquia de subtarefas ou subpolíticas, permitindo resolver problemas de planejamento complexos de maneira mais eficiente.
Meta-Aprendizagem para Planejamento (Meta-Learning for Planning)
Paradigma onde o agente aprende a aprender políticas de planejamento adaptativas que podem se ajustar rapidamente a novos ambientes ou objetivos de planejamento.
Planejamento Multiagente por RL (Multi-Agent RL Planning)
Extensão do RL para cenários onde múltiplos agentes aprendem simultaneamente políticas de planejamento, exigindo a consideração das interações e da cooperação/competição entre agentes.
Planejamento Robusto por RL (Robust RL Planning)
Abordagem que visa aprender políticas de planejamento que mantêm seu desempenho diante de incertezas e variações do ambiente ou do modelo de dinâmica.
Transferência de Aprendizagem em Planejamento RL (Transfer Learning in RL Planning)
Técnica que permite reutilizar conhecimentos ou políticas aprendidas em um contexto de planejamento para acelerar a aprendizagem em um novo contexto similar.
Planejamento por RL com Restrições (Constrained RL Planning)
Formulação de RL onde o agente deve otimizar sua política de planejamento enquanto respeita restrições de segurança, recursos ou outras limitações específicas do domínio.
Aprendizagem por Reforço Baseada em Modelo (RL Baseado em Modelo)
Abordagem onde o agente aprende ou utiliza um modelo explícito da dinâmica do ambiente para melhorar seu planejamento e tomada de decisão, ao contrário do RL sem modelo.
Planejamento Contínuo por RL (Planejamento Contínuo de RL)
Especialização do RL para problemas de planejamento onde os espaços de estados e ações são contínuos, exigindo técnicas de aproximação específicas como os atores-críticos.
Episódio de Planejamento (Episódio de Planejamento)
Sequência completa de interações entre o agente e o ambiente desde um estado inicial até um estado terminal, constituindo uma unidade de aprendizagem para a política de planejamento.
Planejamento por RL com Aprendizagem por Imitação (Aprendizagem por Imitação para Planejamento de RL)
Método onde o agente aprende uma política de planejamento imitando demonstrações de especialistas, frequentemente usado para inicializar ou guiar a aprendizagem por reforço.
Otimização de Política por RL (Otimização de Política)
Classe de algoritmos de RL que otimizam diretamente os parâmetros da política de planejamento para maximizar a recompensa esperada, incluindo métodos como REINFORCE ou PPO.