RL Multi-Objetivo Continuo
Función de Recompensa Vectorial
Función de retorno que devuelve un vector de recompensas en lugar de un escalar, permitiendo capturar simultáneamente múltiples objetivos conflictivos en el aprendizaje por refuerzo.
← Volver