Validación Cruzada Leave-One-Out

📖

términos

Validación Cruzada Leave-One-Out

Técnica de validación cruzada donde cada observación del conjunto de datos se utiliza una sola vez como conjunto de prueba, mientras que las N-1 observaciones restantes se utilizan para el entrenamiento. Este método maximiza el uso de los datos pero implica una alta complejidad computacional.

📖

términos

Error Cuadrático Medio

Métrica de evaluación que mide el promedio de los cuadrados de las diferencias entre los valores predichos y los valores reales, utilizada particularmente en problemas de regresión. Penaliza más los grandes errores debido al efecto cuadrático.

📖

términos

Sesgo-Varianza

Dilema fundamental en aprendizaje automático donde la reducción del sesgo aumenta la varianza y viceversa, afectando la capacidad de generalización del modelo. La optimización consiste en encontrar el equilibrio ideal entre estos dos componentes del error.

📖

términos

Error de Generalización

Medida del rendimiento de un modelo sobre datos no vistos no utilizados durante el entrenamiento, que refleja su capacidad de generalización. Se estima mediante técnicas de validación cruzada para evitar el optimismo sesgado del error de entrenamiento.

📖

términos

Subajuste

Situación donde un modelo es demasiado simple para capturar la estructura subyacente de los datos, resultando en mal rendimiento tanto en conjuntos de entrenamiento como de prueba. Se manifiesta mediante errores elevados y sistemáticos durante la validación cruzada.

📖

términos

Curva de Aprendizaje

Gráfico que representa la evolución del rendimiento del modelo en función del tamaño del conjunto de entrenamiento, revelando problemas de sobreajuste o subajuste. Ayuda a determinar si añadir más datos podría mejorar el rendimiento.

📖

términos

Validación Cruzada Anidada

Técnica avanzada que utiliza dos bucles de validación cruzada para la selección de hiperparámetros y la evaluación del modelo, evitando la fuga de información. El bucle interno optimiza los hiperparámetros mientras que el bucle externo evalúa el rendimiento final.

📖

términos

Intervalo de Confianza

Rango de valores estimado que contiene el valor verdadero de un parámetro con un nivel de confianza específico, calculado a partir de los resultados de validación cruzada. Cuantifica la incertidumbre asociada a las estimaciones de rendimiento del modelo.

📖

términos

Prueba de Significancia Estadística

Procedimiento que determina si las diferencias de rendimiento entre modelos son estadísticamente significativas o se deben al azar. Se aplican pruebas como la prueba t de Student pareada o la prueba de Wilcoxon sobre las puntuaciones de validación cruzada.

📖

términos

Validación Cruzada Leave-P-Out

Generalización de LOOCV donde P observaciones se dejan fuera para la prueba en cada iteración, creando C(N,P) combinaciones posibles. Ofrece un compromiso entre LOOCV y K-fold en términos de sesgo-varianza y costo computacional.

📖

términos

Validación Cruzada Repetida

Técnica que repite la validación cruzada K-fold varias veces con diferentes particiones iniciales para reducir la varianza de la estimación del rendimiento. Proporciona una evaluación más estable a costa de un mayor tiempo de cálculo.

📖

términos

Ajuste de Hiperparámetros

Proceso de optimización de los hiperparámetros del modelo utilizando validación cruzada para evaluar cada configuración y evitar el sobreajuste en el conjunto de prueba. Los enfoques incluyen Búsqueda en Cuadrícula, Búsqueda Aleatoria y Optimización Bayesiana.

Glosario IA