RL Profundo Multi-Objetivo
Função de Valor Vetorial
Extensão da função de valor Q na aprendizagem por reforço, onde cada par estado-ação é associado a um vetor de valores, um por objetivo. Esta representação permite capturar os compromissos entre diferentes objetivos sem a necessidade de agregação a priori.
← Voltar