Glossário IA
O dicionário completo da Inteligência Artificial
Função de Valor Multi-Objetivo
Extensão vetorial da função de valor clássica que estima os retornos esperados para cada objetivo considerado separadamente. Permite a avaliação simultânea do desempenho de uma política de acordo com múltiplos critérios.
Política de Equilíbrio
Estratégia de decisão que mantém um compromisso estável entre diferentes objetivos antagônicos ao longo do tempo. Representa uma solução duradoura em ambientes onde os objetivos entram em conflito.
Vetor de Recompensa
Estrutura de dados multidimensional contendo os valores de recompensa para cada objetivo em cada etapa de interação. Constitui o elemento fundamental de feedback nos sistemas MORL.
Fronteira de Pareto
Conjunto completo de soluções não-dominadas que representam todos os compromissos ótimos possíveis entre objetivos. Visualiza o espaço de soluções candidatas na aprendizagem por reforço multi-objetivo.
Política Estocástica Multi-Objetivo
Distribuição de probabilidades sobre as ações que otimiza simultaneamente múltiplos objetivos de acordo com diferentes pesos. Permite a exploração de vários compromissos entre objetivos durante a tomada de decisão.
Hiperplano de Ponderação
Subespaço vetorial que define os pesos relativos atribuídos a cada objetivo na escalarização. Determina a orientação da otimização no espaço multi-objetivo.
Espaços de Ação Multi-Objetivo
Estruturas onde cada ação pode ter impactos diferentes em cada objetivo considerado. Necessitam de algoritmos especializados para gerir a complexidade das decisões multi-critério.
Aprendizagem por Reforço Escalarizada
Paradigma que transforma o problema multi-objetivo numa série de problemas mono-objetivo através de diferentes escalarizações. Permite a utilização de algoritmos padrão para descobrir o conjunto de Pareto.
Otimização Convexa Multiobjetivo
Classe de problemas onde as funções objetivo são convexas, garantindo fortes propriedades teóricas sobre as soluções ótimas. Facilita a convergência e a análise de políticas multiobjetivo.
Métrica de Hipervolume
Indicador de desempenho que mede o volume do espaço objetivo dominado por um conjunto de soluções. Permite a comparação quantitativa de conjuntos de políticas multiobjetivo.
Política Contextual Multiobjetivo
Abordagem onde os pesos dos objetivos dependem do contexto ou do estado do ambiente. Permite uma adaptação fina dos compromissos de acordo com as situações encontradas.