Métodos de Compromiso
Q-Learning Multi-Objetivo
Extensión del Q-learning tradicional donde cada acción posee un vector de valores Q en lugar de un valor escalar, necesitando criterios de selección de acción específicos para los compromisos.
← Volver