Glosario IA
El diccionario completo de la Inteligencia Artificial
Validación Cruzada Leave-One-Out
Técnica de validación cruzada donde cada observación del conjunto de datos se utiliza una sola vez como conjunto de prueba, mientras que las N-1 observaciones restantes se utilizan para el entrenamiento. Este método maximiza el uso de los datos pero implica una alta complejidad computacional.
Error Cuadrático Medio
Métrica de evaluación que mide el promedio de los cuadrados de las diferencias entre los valores predichos y los valores reales, utilizada particularmente en problemas de regresión. Penaliza más los grandes errores debido al efecto cuadrático.
Sesgo-Varianza
Dilema fundamental en aprendizaje automático donde la reducción del sesgo aumenta la varianza y viceversa, afectando la capacidad de generalización del modelo. La optimización consiste en encontrar el equilibrio ideal entre estos dos componentes del error.
Error de Generalización
Medida del rendimiento de un modelo sobre datos no vistos no utilizados durante el entrenamiento, que refleja su capacidad de generalización. Se estima mediante técnicas de validación cruzada para evitar el optimismo sesgado del error de entrenamiento.
Subajuste
Situación donde un modelo es demasiado simple para capturar la estructura subyacente de los datos, resultando en mal rendimiento tanto en conjuntos de entrenamiento como de prueba. Se manifiesta mediante errores elevados y sistemáticos durante la validación cruzada.
Curva de Aprendizaje
Gráfico que representa la evolución del rendimiento del modelo en función del tamaño del conjunto de entrenamiento, revelando problemas de sobreajuste o subajuste. Ayuda a determinar si añadir más datos podría mejorar el rendimiento.
Validación Cruzada Anidada
Técnica avanzada que utiliza dos bucles de validación cruzada para la selección de hiperparámetros y la evaluación del modelo, evitando la fuga de información. El bucle interno optimiza los hiperparámetros mientras que el bucle externo evalúa el rendimiento final.
Intervalo de Confianza
Rango de valores estimado que contiene el valor verdadero de un parámetro con un nivel de confianza específico, calculado a partir de los resultados de validación cruzada. Cuantifica la incertidumbre asociada a las estimaciones de rendimiento del modelo.
Prueba de Significancia Estadística
Procedimiento que determina si las diferencias de rendimiento entre modelos son estadísticamente significativas o se deben al azar. Se aplican pruebas como la prueba t de Student pareada o la prueba de Wilcoxon sobre las puntuaciones de validación cruzada.
Validación Cruzada Leave-P-Out
Generalización de LOOCV donde P observaciones se dejan fuera para la prueba en cada iteración, creando C(N,P) combinaciones posibles. Ofrece un compromiso entre LOOCV y K-fold en términos de sesgo-varianza y costo computacional.
Validación Cruzada Repetida
Técnica que repite la validación cruzada K-fold varias veces con diferentes particiones iniciales para reducir la varianza de la estimación del rendimiento. Proporciona una evaluación más estable a costa de un mayor tiempo de cálculo.
Ajuste de Hiperparámetros
Proceso de optimización de los hiperparámetros del modelo utilizando validación cruzada para evaluar cada configuración y evitar el sobreajuste en el conjunto de prueba. Los enfoques incluyen Búsqueda en Cuadrícula, Búsqueda Aleatoria y Optimización Bayesiana.