Planejamento por Aprendizagem por Reforço
Modelagem de Recompensa (Reward Shaping)
Técnica de design de recompensas que modifica a função de recompensa original para guiar mais eficazmente o agente em direção a comportamentos de planejamento desejáveis.
← Voltar