Funciones de Valor Multi-Objetivo
Matriz de Recompensa Multiobjetivo
Estructura de datos que almacena las recompensas vectoriales asociadas a cada transición estado-acción, donde cada dimensión corresponde a un objetivo específico.
← Volver