Funções de Valor Multi-Objetivo
Matriz de Recompensa Multi-Objetivo
Estrutura de dados que armazena as recompensas vetoriais associadas a cada transição estado-ação, onde cada dimensão corresponde a um objetivo específico.
← Voltar