Aprendizagem por Reforço Hierárquico
Função de Término
Função que determina quando uma opção deve parar e retornar o controle ao nível superior, crucial para a coordenação temporal entre os níveis hierárquicos.
← Voltar