Aprendizagem por Curiosidade Baseada em Modelo
Modelagem da Recompensa Intrínseca
O processo de design e ponderação do sinal de recompensa intrínseca, frequentemente combinando-o com a recompensa extrínseca da tarefa. Uma boa modelagem é crucial para equilibrar exploração e explotação.
← Voltar