Evaluación de Políticas Multi-Objetivo
Agregación de Recompensas
Técnica que combina múltiples señales de recompensa en una señal única para el aprendizaje, pudiendo ser lineal, no lineal o adaptativa según las preferencias.
← Volver