RL Multi-Objetivo Continuo
Políticas Estocásticas Multiobjetivo
Políticas probabilísticas en espacios de acción continuos que optimizan simultáneamente múltiples objetivos, a menudo implementadas como distribuciones gaussianas parametrizadas.
← Volver