Glossário IA
O dicionário completo da Inteligência Artificial
Curva de validação
Gráfico que mostra o desempenho do modelo em um conjunto de validação separado em paralelo com a curva de aprendizado para detectar overfitting.
Ponto de convergência
Momento em que as curvas de aprendizado e validação se estabilizam, indicando que a adição de mais dados não melhorará significativamente o desempenho.
Gap de generalização
Diferença entre o desempenho nos dados de treinamento e nos dados de validação, medindo a capacidade do modelo de generalizar para novos dados.
Erro de aprendizado
Medida do erro cometido pelo modelo no conjunto de treinamento, servindo como referência para avaliar possível overfitting.
Erro de validação
Desempenho do modelo avaliado em um conjunto de dados não utilizado durante o treinamento, refletindo sua capacidade real de generalização.
Platô de aprendizado
Fase em que a adição de mais dados de treinamento não produz mais melhorias significativas no desempenho do modelo.
Diagnóstico de viés
Análise da curva de aprendizado para determinar se o modelo sofre de underfitting (viés alto) exigindo um modelo mais complexo.
Diagnóstico de variância
Identificação de overfitting (variância alta) quando o erro de treinamento é baixo, mas o erro de validação permanece alto.
Complexidade do modelo
Fator que influencia a forma da curva de aprendizado, onde um modelo muito complexo tende a sofrer sobreajuste enquanto um modelo muito simples sofre de subajuste.
Tamanho crítico da amostra
Número mínimo de dados de treinamento necessários para alcançar desempenhos estáveis e generalizáveis do modelo.
Curva de aprendizado por classe
Análise separada das curvas de aprendizado para cada classe de saída, particularmente útil em problemas de classificação desbalanceados.
Taxa de melhoria marginal
Medida do ganho de desempenho obtido ao adicionar unidades adicionais de dados de treinamento, ajudando a decidir sobre a relevância de coletar mais dados.
Validação cruzada iterativa
Técnica que combina validação cruzada e curvas de aprendizado para avaliar robustamente o desempenho em diferentes tamanhos de amostra.
Ruído nos dados
Erro aleatório nos dados de treinamento que afeta a forma da curva de aprendizado e limita os desempenhos alcançáveis do modelo.