Glossário IA
O dicionário completo da Inteligência Artificial
RL^2 (Reinforcement Learning Squared)
Estrutura de meta-aprendizagem onde a própria rede neural implementa um algoritmo de aprendizagem por reforço, aprendendo a se adaptar a novas tarefas a partir de sequências de transições.
Proximal Meta-Policy Optimization (ProMP)
Algoritmo de meta-aprendizagem baseado em PPO que mantém um conjunto de meta-parâmetros otimizados para uma rápida adaptação a novas tarefas por reforço.
Inner Loop/Outer Loop
Estrutura de otimização de dois níveis onde o loop interno se adapta a tarefas específicas e o loop externo meta-otimiza os parâmetros para uma melhor adaptação.
Exploration Strategies
Mecanismos que permitem ao agente de meta-aprendizagem explorar eficientemente novas tarefas para coletar rapidamente informações relevantes para a adaptação.
Few-shot Reinforcement Learning
Cenário onde o agente deve aprender uma nova tarefa com muito poucos exemplos ou interações, tipicamente de 1 a 10 episódios.
Meta-Actor-Critic
Arquitetura que combina meta-aprendizagem com métodos ator-crítico, onde ambos os componentes são otimizados para uma rápida adaptação a novas tarefas.
Task-Agnostic Exploration
Abordagem de exploração que não requer conhecimento prévio da distribuição das tarefas, permitindo a adaptação a tarefas inesperadas.
Meta-Value Function
Função de valor parametrizada para estimar o desempenho esperado de uma política adaptada a uma dada nova tarefa.