Glosario IA
El diccionario completo de la Inteligencia Artificial
Validación Cruzada
Técnica de evaluación que divide los datos en subconjuntos para probar la generalización del modelo en varias iteraciones.
Pruebas Estadísticas
Métodos estadísticos formales para comparar significativamente el rendimiento entre diferentes modelos o configuraciones.
Métricas de Rendimiento
Conjunto de indicadores cuantitativos (precisión, recall, puntuación F1, MAE, RMSE) que miden la calidad de las predicciones según el contexto.
Análisis Sesgo-Varianza
Descomposición del error de generalización en sesgo (subajuste) y varianza (sobreajuste) para optimizar la complejidad del modelo.
Pruebas de Robustez
Evaluación de la estabilidad de las predicciones frente a perturbaciones, ruido y variaciones en los datos de entrada.
Validación Temporal
Metodología específica para datos secuenciales donde el entrenamiento utiliza períodos anteriores a la prueba para simular condiciones reales.
Curvas ROC y AUC
Herramientas gráficas y métricas para evaluar el rendimiento de clasificadores binarios en diferentes umbrales de decisión.
Calibración de Modelos
Ajuste de las probabilidades predichas para que reflejen fielmente las verdaderas frecuencias de ocurrencia de los eventos.
Pruebas de Equidad
Evaluación de sesgos demográficos y discriminación potencial del modelo según criterios éticos y regulatorios.
Análisis de Errores
Examen sistemático de las predicciones incorrectas para identificar patrones de fallo y guiar la mejora del modelo.
Validación por Bootstrap
Técnica de remuestreo con reemplazo para estimar la variabilidad y la fiabilidad de las métricas de rendimiento.
Pruebas de Estrés
Evaluación del comportamiento del modelo en condiciones extremas o casos límite para identificar sus límites operativos.
Pruebas de Sensibilidad
Análisis del impacto de las variaciones de las características de entrada en las predicciones para comprender la estabilidad del modelo.
Validación Externa
Prueba del modelo con datos provenientes de fuentes o distribuciones completamente nuevas para evaluar su capacidad de generalización.
Pruebas de Degradación
Monitoreo continuo del rendimiento del modelo en producción para detectar derivas de datos y la degradación temporal.