Glossário IA
O dicionário completo da Inteligência Artificial
Validação Cruzada Leave-One-Out
Técnica de validação cruzada onde cada observação do conjunto de dados é usada uma única vez como conjunto de teste, enquanto as N-1 observações restantes servem para treinamento. Este método maximiza o uso dos dados, mas resulta em alta complexidade computacional.
Erro Quadrático Médio
Métrica de avaliação que mede a média dos quadrados das diferenças entre valores previstos e valores reais, particularmente utilizada em problemas de regressão. Penaliza mais fortemente os grandes erros devido ao efeito quadrático.
Dilema Viés-Variância
Dilema fundamental em aprendizado de máquina onde a redução do viés aumenta a variância e vice-versa, afetando a capacidade de generalização do modelo. A otimização consiste em encontrar o equilíbrio ideal entre estes dois componentes do erro.
Erro de Generalização
Medida do desempenho de um modelo em dados não vistos que não foram utilizados durante o treinamento, refletindo sua capacidade de generalização. É estimada por técnicas de validação cruzada para evitar o otimismo tendencioso do erro de treinamento.
Subaprendizado
Situação onde um modelo é muito simples para capturar a estrutura subjacente dos dados, resultando em desempenhos ruins tanto nos conjuntos de treinamento quanto de teste. Manifesta-se por erros elevados e sistemáticos durante a validação cruzada.
Curva de Aprendizado
Gráfico que representa a evolução do desempenho do modelo em função do tamanho do conjunto de treinamento, revelando problemas de sobreaprendizado ou subaprendizado. Ajuda a determinar se a adição de dados poderia melhorar o desempenho.
Validação Cruzada Aninhada
Técnica avançada que utiliza dois loops de validação cruzada para seleção de hiperparâmetros e avaliação do modelo, evitando vazamento de informação. O loop interno otimiza os hiperparâmetros enquanto o loop externo avalia o desempenho final.
Intervalo de Confiança
Faixa de valores estimada contendo o valor verdadeiro de um parâmetro com um nível de confiança especificado, calculada a partir dos resultados de validação cruzada. Quantifica a incerteza associada às estimativas de desempenho do modelo.
Teste de Significância Estatística
Procedimento que determina se as diferenças de desempenho entre modelos são estatisticamente significativas ou devidas ao acaso. Testes como t-test de Student pareado ou teste de Wilcoxon são aplicados sobre os scores de validação cruzada.
Validação Cruzada Leave-P-Out
Generalização do LOOCV onde P observações são deixadas de lado para o teste em cada iteração, criando C(N,P) combinações possíveis. Oferece um compromisso entre LOOCV e K-fold em termos de viés-variância e custo computacional.
Validação Cruzada Repetida
Técnica que repete a validação cruzada K-fold várias vezes com diferentes partições iniciais para reduzir a variância da estimativa de desempenho. Fornece uma avaliação mais estável ao custo de um tempo de cálculo aumentado.
Ajuste de Hiperparâmetros
Processo de otimização dos hiperparâmetros do modelo usando validação cruzada para avaliar cada configuração e evitar sobreajuste no conjunto de teste. As abordagens incluem Grid Search, Random Search e Bayesian Optimization.