Aprendizagem por Reforço Hierárquico Multiobjetivo
Decomposição da Função de Valor
Técnica que decompõe a função de valor global em contribuições de cada subtarefa e objetivo, facilitando a aprendizagem distribuída nas hierarquias.
← Voltar