Meta-aprendizagem por Reforço
Meta-Value Function
Função de valor parametrizada para estimar o desempenho esperado de uma política adaptada a uma dada nova tarefa.
← VoltarFunção de valor parametrizada para estimar o desempenho esperado de uma política adaptada a uma dada nova tarefa.
← Voltar