Métodos de Compromisso
Q-Learning Multi-Objetivo
Extensão do Q-learning tradicional onde cada ação possui um vetor de Q-valores em vez de um valor escalar, necessitando de critérios de seleção de ação específicos para os compromissos.
← Voltar