Meta-aprendizagem por Reforço
Inner Loop/Outer Loop
Estrutura de otimização de dois níveis onde o loop interno se adapta a tarefas específicas e o loop externo meta-otimiza os parâmetros para uma melhor adaptação.
← Voltar