Glossário IA
O dicionário completo da Inteligência Artificial
Prior Probability Shift
Mudança na distribuição da variável alvo (y) enquanto a distribuição condicional P(X|y) permanece constante, afetando as previsões do modelo.
Population Stability Index (PSI)
Métrica quantitativa que mede a diferença de distribuição entre dois conjuntos de dados (ex: treinamento vs produção), usada para detectar e quantificar o data drift.
Kolmogorov-Smirnov (KS) Test
Teste estatístico não paramétrico que compara as funções de distribuição cumulativas de duas amostras para determinar se elas provêm da mesma distribuição.
Hellinger Distance
Métrica de similaridade entre duas distribuições de probabilidade, limitada entre 0 e 1, usada para quantificar a magnitude do data drift de forma interpretável.
Drift Detection Threshold
Valor crítico predefinido para uma métrica de drift (como o PSI) além do qual um alerta de degradação dos dados é acionado para uma reavaliação do modelo.
Reference Window
Período temporal ou conjunto de dados usado como base de referência estável para comparar distribuições futuras e identificar o data drift.
Detection Window
Intervalo temporal deslizante sobre os dados em produção no qual as estatísticas são calculadas para comparação com a janela de referência durante o monitoramento do drift.
Feature-wise Drift Detection
Análise do drift ao nível de cada variável individual (feature) para identificar as características específicas cuja distribuição mudou, facilitando o diagnóstico.
Detecção de Drift Multivariado
Abordagem que analisa simultaneamente as mudanças na distribuição conjunta de múltiplas características, capaz de detectar drifts não visíveis a nível univariado.
Detecção de Drift Incremental
Métodos de detecção que atualizam as estatísticas de referência à medida que novos dados chegam, adaptando o modelo a mudanças graduais.
Janelamento Adaptativo
Técnica onde o tamanho da janela de detecção se ajusta dinamicamente em função da taxa de mudança detectada, permitindo uma reatividade variável aos drifts.
Análise da Causa Raiz do Drift
Processo de investigação que visa identificar a origem fundamental do data drift (ex: mudança de processo, erro de coleta, evolução do comportamento do usuário).
Gatilho de Retreinamento do Modelo
Condição automatizada, frequentemente baseada na superação de um limiar de drift, que inicia o processo de retreinamento ou atualização de um modelo de machine learning.
Controle Estatístico de Processo (CEP) para ML
Aplicação de métodos de controle de qualidade industrial, como os gráficos de controle, à monitorização das métricas de modelos para uma detecção robusta do drift.