Glossário IA
O dicionário completo da Inteligência Artificial
Incerteza Epistêmica
Incerteza ligada ao conhecimento do modelo que diminui com mais dados, distinguida da incerteza aleatória inerente às observações.
Distribuição de Política
Distribuição probabilística das ações sob uma política dada, essencial para avaliar a divergência com os dados offline.
Fora de Distribuição (OOD)
Ações ou estados não observados no conjunto de dados de treinamento, exigindo uma quantificação de incerteza para evitar extrapolações perigosas.
Quantificação de Incerteza
Processo sistemático de estimativa e medição das incertezas nas previsões do modelo para guiar a tomada de decisão.
Aprendizagem por Reforço Offline
Paradigma de aprendizagem a partir de um conjunto de dados fixo sem interação com o ambiente, exigindo uma gestão rigorosa da incerteza.
Conjuntos de Modelos
Técnica que utiliza vários modelos treinados de forma diferente para estimar a incerteza epistêmica pela dispersão das previsões.
Aproximação Bayesiana
Métodos de aproximação da inferência bayesiana para quantificar a incerteza epistêmica nos parâmetros do modelo.
Variabilidade Epistêmica
Medida da dispersão das previsões do modelo devido ao conhecimento limitado dos dados de treinamento.
Calibração de Incerteza
Processo de ajuste das pontuações de incerteza para que reflitam fielmente as probabilidades de erro reais.
Desvio Padrão Epistêmico
Métrica que quantifica a dispersão das previsões do modelo devido à incerteza sobre os parâmetros, distinta da variância das observações.
Estimativa de Confiança
Avaliação quantitativa da confiabilidade das previsões do modelo baseada na densidade local dos dados de treinamento.
Robustez à Incerteza
Capacidade de um algoritmo de manter um desempenho estável diante de previsões incertas ou dados fora da distribuição.
Extrapolação Conservadora
Estratégia que limita a extrapolação para fora do suporte dos dados, utilizando limites superiores conservadores baseados na incerteza.
Distribuição Empírica
Distribuição dos estados-ações observados no conjunto de dados offline, servindo como referência para detectar divergências de política.
Pontuação de Incerteza
Métrica numérica que quantifica o nível de incerteza epistêmica associada a uma previsão ou ação específica.
Fronteira de Distribuição
Limite espacial no espaço de estados-ações que delimita as regiões bem cobertas pelos dados de treinamento.
Tomada de Decisão Informada
Processo decisório que integra explicitamente medidas de incerteza epistêmica para evitar ações de alto risco fora da distribuição.