Glossário IA
O dicionário completo da Inteligência Artificial
Validação Cruzada
Técnica de avaliação que particiona os dados em subconjuntos para testar a generalização do modelo em várias iterações.
Testes Estatísticos
Métodos estatísticos formais para comparar significativamente o desempenho entre diferentes modelos ou configurações.
Métricas de Desempenho
Conjunto de indicadores quantitativos (precisão, recall, F1-score, MAE, RMSE) que medem a qualidade das previsões de acordo com o contexto.
Análise Viés-Variância
Decomposição do erro de generalização em viés (subajuste) e variância (sobreajuste) para otimizar a complexidade do modelo.
Testes de Robustez
Avaliação da estabilidade das previsões face a perturbações, ruído e variações nos dados de entrada.
Validação Temporal
Metodologia específica para dados sequenciais onde o treinamento utiliza períodos anteriores ao teste para simular condições reais.
Curvas ROC e AUC
Ferramentas gráficas e métricas para avaliar o desempenho de classificadores binários em diferentes limiares de decisão.
Calibração de Modelos
Ajuste das probabilidades previstas para que reflitam fielmente as verdadeiras frequências de ocorrência dos eventos.
Testes de Equidade
Avaliação dos vieses demográficos e discriminação potencial do modelo de acordo com critérios éticos e regulatórios.
Análise de Erros
Revisão sistemática de previsões incorretas para identificar padrões de falha e guiar a melhoria do modelo.
Validação por Bootstrap
Técnica de reamostragem com substituição para estimar a variabilidade e a confiabilidade das métricas de desempenho.
Testes de Estresse
Avaliação do comportamento do modelo em condições extremas ou casos de limite para identificar seus limites operacionais.
Testes de Sensibilidade
Análise do impacto das variações das características de entrada nas previsões para compreender a estabilidade do modelo.
Validação Externa
Teste do modelo em dados provenientes de fontes ou distribuições completamente novas para avaliar sua capacidade de generalização.
Testes de Degradação
Monitoramento contínuo do desempenho do modelo em produção para detectar desvios de dados e degradação temporal.