Glossário IA
O dicionário completo da Inteligência Artificial
Ótimo de Pareto
Solução ótima em um contexto multi-objetivo que não pode ser melhorada em nenhum objetivo sem degradar o desempenho em pelo menos outro objetivo.
Aprendizagem por Reforço Multi-Objetivo
Extensão da aprendizagem por reforço onde o agente otimiza simultaneamente vários objetivos frequentemente conflitantes com funções de recompensa vetoriais.
Função de recompensa vetorial
Função que retorna um vetor de recompensas em vez de um valor escalar, permitindo a consideração simultânea de múltiplos critérios de desempenho.
Ponderação de objetivos
Técnica de escalarização onde cada objetivo recebe um peso para combinar as múltiplas recompensas em um único valor escalarizado a ser otimizado.
Escalarização linear
Método que transforma um problema multi-objetivo em um problema escalar por combinação linear ponderada dos objetivos para gerar diferentes soluções Pareto-ótimas.
Elitismo de Pareto
Estratégia que preserva as soluções não dominadas entre as gerações para garantir a convergência para a frente de Pareto em algoritmos evolucionários.
Retorno vetorial esperado
Generalização do retorno esperado na aprendizagem por reforço, calculando a expectativa do vetor de recompensas cumulativas futuras para cada política.
Política Pareto-ótima
Política de ação cujo retorno vetorial pertence à frente de Pareto, representando um compromisso ótimo entre os diferentes objetivos.
Convergência de Pareto
Propriedade de um algoritmo que garante que as soluções geradas tendem assintoticamente para a verdadeira fronteira de Pareto do problema.
Agregação de Tchebychev
Método de escalarização que utiliza a norma de Tchebychev para combinar os objetivos, capaz de gerar todas as soluções Pareto-ótimas convexas e não-convexas.