Glosario IA
El diccionario completo de la Inteligencia Artificial
Curva de validación
Gráfico que muestra el rendimiento del modelo en un conjunto de validación separado en paralelo a la curva de aprendizaje para detectar sobreajuste.
Punto de convergencia
Momento en que las curvas de aprendizaje y validación se estabilizan, indicando que agregar más datos no mejorará significativamente el rendimiento.
Brecha de generalización
Diferencia entre el rendimiento en los datos de entrenamiento y los datos de validación, midiendo la capacidad del modelo para generalizar a nuevos datos.
Error de aprendizaje
Medida del error cometido por el modelo en el conjunto de entrenamiento, que sirve como referencia para evaluar el posible sobreajuste.
Error de validación
Rendimiento del modelo evaluado en un conjunto de datos no utilizado durante el entrenamiento, reflejando su capacidad de generalización real.
Meseta de aprendizaje
Fase en la que agregar más datos de entrenamiento no produce una mejora significativa en el rendimiento del modelo.
Diagnóstico de sesgo
Análisis de la curva de aprendizaje para determinar si el modelo sufre de subajuste (sesgo alto) requiriendo un modelo más complejo.
Diagnóstico de varianza
Identificación de sobreajuste (varianza alta) cuando el error de entrenamiento es bajo pero el error de validación permanece alto.
Complejidad del modelo
Factor que influye en la forma de la curva de aprendizaje, donde un modelo demasiado complejo tiende a sobreajustar mientras que uno demasiado simple subajusta.
Tamaño crítico de muestra
Número mínimo de datos de entrenamiento necesarios para alcanzar un rendimiento estable y generalizable del modelo.
Curva de aprendizaje por clase
Análisis separado de las curvas de aprendizaje para cada clase de salida, particularmente útil en problemas de clasificación desbalanceados.
Tasa de mejora marginal
Medida de la ganancia de rendimiento obtenida al añadir unidades adicionales de datos de entrenamiento, ayudando a decidir la pertinencia de recolectar más datos.
Validación cruzada iterativa
Técnica que combina validación cruzada y curvas de aprendizaje para evaluar robustamente el rendimiento en diferentes tamaños de muestra.
Ruido en los datos
Error aleatorio en los datos de entrenamiento que afecta la forma de la curva de aprendizaje y limita el rendimiento alcanzable del modelo.