RL Profundo Multi-Objetivo
Recompensa Vetorial
Estrutura de recompensa onde cada ação em um estado gera um vetor de recompensas, em vez de um único valor escalar. Cada componente do vetor corresponde ao progresso em um objetivo específico do problema.
← Voltar