Validação Cruzada Leave-One-Out

📖

termos

Validação Cruzada Leave-One-Out

Técnica de validação cruzada onde cada observação do conjunto de dados é usada uma única vez como conjunto de teste, enquanto as N-1 observações restantes servem para treinamento. Este método maximiza o uso dos dados, mas resulta em alta complexidade computacional.

📖

termos

Erro Quadrático Médio

Métrica de avaliação que mede a média dos quadrados das diferenças entre valores previstos e valores reais, particularmente utilizada em problemas de regressão. Penaliza mais fortemente os grandes erros devido ao efeito quadrático.

📖

termos

Dilema Viés-Variância

Dilema fundamental em aprendizado de máquina onde a redução do viés aumenta a variância e vice-versa, afetando a capacidade de generalização do modelo. A otimização consiste em encontrar o equilíbrio ideal entre estes dois componentes do erro.

📖

termos

Erro de Generalização

Medida do desempenho de um modelo em dados não vistos que não foram utilizados durante o treinamento, refletindo sua capacidade de generalização. É estimada por técnicas de validação cruzada para evitar o otimismo tendencioso do erro de treinamento.

📖

termos

Subaprendizado

Situação onde um modelo é muito simples para capturar a estrutura subjacente dos dados, resultando em desempenhos ruins tanto nos conjuntos de treinamento quanto de teste. Manifesta-se por erros elevados e sistemáticos durante a validação cruzada.

📖

termos

Curva de Aprendizado

Gráfico que representa a evolução do desempenho do modelo em função do tamanho do conjunto de treinamento, revelando problemas de sobreaprendizado ou subaprendizado. Ajuda a determinar se a adição de dados poderia melhorar o desempenho.

📖

termos

Validação Cruzada Aninhada

Técnica avançada que utiliza dois loops de validação cruzada para seleção de hiperparâmetros e avaliação do modelo, evitando vazamento de informação. O loop interno otimiza os hiperparâmetros enquanto o loop externo avalia o desempenho final.

📖

termos

Intervalo de Confiança

Faixa de valores estimada contendo o valor verdadeiro de um parâmetro com um nível de confiança especificado, calculada a partir dos resultados de validação cruzada. Quantifica a incerteza associada às estimativas de desempenho do modelo.

📖

termos

Teste de Significância Estatística

Procedimento que determina se as diferenças de desempenho entre modelos são estatisticamente significativas ou devidas ao acaso. Testes como t-test de Student pareado ou teste de Wilcoxon são aplicados sobre os scores de validação cruzada.

📖

termos

Validação Cruzada Leave-P-Out

Generalização do LOOCV onde P observações são deixadas de lado para o teste em cada iteração, criando C(N,P) combinações possíveis. Oferece um compromisso entre LOOCV e K-fold em termos de viés-variância e custo computacional.

📖

termos

Validação Cruzada Repetida

Técnica que repete a validação cruzada K-fold várias vezes com diferentes partições iniciais para reduzir a variância da estimativa de desempenho. Fornece uma avaliação mais estável ao custo de um tempo de cálculo aumentado.

📖

termos

Ajuste de Hiperparâmetros

Processo de otimização dos hiperparâmetros do modelo usando validação cruzada para avaliar cada configuração e evitar sobreajuste no conjunto de teste. As abordagens incluem Grid Search, Random Search e Bayesian Optimization.

Glossário IA