Glossário IA
O dicionário completo da Inteligência Artificial
Teste de Regressão de Modelo
Procedimento automatizado que verifica se um novo modelo ou uma nova versão de pipeline não degrada o desempenho em comparação com uma versão de referência em um conjunto de dados de teste fixo.
Validação de Desvio de Dados (Data Drift Validation)
Teste automatizado que compara a distribuição estatística de novos dados de produção com a dos dados de treinamento para detectar mudanças significativas que podem impactar o desempenho do modelo.
Teste de Viés (Bias Testing)
Conjunto de automações que medem e quantificam os preconceitos sistemáticos de um modelo em relação a subgrupos demográficos específicos para garantir a equidade e a ética algorítmica.
Teste de Conformidade (Compliance Testing)
Verificação automatizada de que um modelo e seus dados respeitam as regulamentações e padrões em vigor, como o GDPR para a proteção de dados pessoais.
Teste de Desempenho de Latência
Medição automatizada do tempo de resposta de um modelo em condições de carga, garantindo que ele respeite os requisitos de tempo real para uma aplicação em produção.
Validação da Coerência das Features
Teste automatizado que garante que as características (features) calculadas pelo pipeline respeitam as restrições de esquema, tipo e faixa de valores esperadas pelo modelo.
Teste de Estabilidade do Pipeline
Validação automatizada de todas as etapas de um pipeline de ML (pré-processamento, treinamento, inferência) para garantir que ele seja executado de forma determinística e sem erros.
Teste de Segurança Adversarial
Avaliação automatizada da vulnerabilidade de um modelo a ataques por exemplos contraditórios (adversarial examples), projetados para induzir previsões errôneas.
Teste de Monotonia
Verificação automatizada para modelos onde se espera uma relação monótona entre uma característica (feature) e a previsão, garantindo que o aumento da característica resulte em uma previsão crescente (ou decrescente).
Validação da Qualidade dos Dados (Data Quality Validation)
Conjunto de testes automatizados que verificam a exaustividade, unicidade, validade e consistência dos dados brutos antes de sua ingestão no pipeline de treinamento ou inferência.
Teste de Degradação de Métricas
Monitoramento contínuo que aciona um alerta se as métricas de desempenho do modelo (ex: F1-score, AUC) caírem abaixo de um limite predefinido nos dados de produção.
Teste de Integração de Modelo
Validação automatizada da interação correta entre o modelo treinado e os outros componentes do sistema, como APIs, bancos de dados e serviços de monitoramento.
Shadow Testing
Técnica onde um novo modelo é implantado em paralelo ao modelo de produção, recebendo o mesmo tráfego real, mas sem impactar os usuários, para comparar seus desempenhos antes da transição.
Teste de Replicação Experimental
Automação que verifica a reprodutibilidade dos resultados de um treinamento, executando o mesmo pipeline com sementes aleatórias fixas, garantindo que as variações sejam mínimas e controladas.
Canary Testing para Modelos ML
Estratégia de implantação onde uma nova versão do modelo é exposta a uma pequena porcentagem do tráfego de usuários em produção, permitindo uma validação em condições reais antes de uma implantação completa.
Teste de Dependências de Pipeline
Validação automatizada de que todas as bibliotecas, versões de software e recursos externos exigidos pelo pipeline de ML estão presentes e são compatíveis no ambiente de execução alvo.