Glosario IA
El diccionario completo de la Inteligencia Artificial
Prueba de Regresión del Modelo
Procedimiento automatizado que verifica que un nuevo modelo o una nueva versión de pipeline no degrade las rendimientos en comparación con una versión de referencia en un conjunto de datos de prueba fijo.
Validación de Deriva de Datos (Data Drift Validation)
Prueba automatizada que compara la distribución estadística de los nuevos datos de producción con la de los datos de entrenamiento para detectar cambios significativos que puedan impactar el rendimiento del modelo.
Prueba de Sesgo (Bias Testing)
Conjunto de automatismos que miden y cuantifican los prejuicios sistemáticos de un modelo hacia subgrupos demográficos específicos para garantizar la equidad y la ética algorítmica.
Prueba de Cumplimiento (Compliance Testing)
Verificación automatizada de que un modelo y sus datos cumplen con las regulaciones y estándares vigentes, como el RGPD para la protección de datos personales.
Prueba de Rendimiento de Latencia
Medición automatizada del tiempo de respuesta de un modelo en condiciones de carga, garantizando que cumpla con los requisitos de tiempo real para una aplicación en producción.
Validación de la Coherencia de las Características
Prueba automatizada que asegura que las características calculadas por el pipeline respetan las restricciones de esquema, tipo y rango de valores esperados por el modelo.
Prueba de Estabilidad del Pipeline
Validación automatizada de todas las etapas de un pipeline ML (preprocesamiento, entrenamiento, inferencia) para asegurar que se ejecute de manera determinista y sin errores.
Prueba de Seguridad Adversarial
Evaluación automatizada de la vulnerabilidad de un modelo a ataques por ejemplos contradictorios (adversarial examples), diseñados para inducir predicciones erróneas.
Prueba de Monotonía
Verificación automatizada para modelos donde se espera una relación monotónica entre una característica y la predicción, asegurando que el aumento de la característica resulte en una predicción creciente (o decreciente).
Validación de la Calidad de los Datos (Data Quality Validation)
Conjunto de pruebas automatizadas que verifican la exhaustividad, unicidad, validez y coherencia de los datos brutos antes de su ingesta en el pipeline de entrenamiento o inferencia.
Prueba de Degradación de Métricas
Monitoreo continuo que activa una alerta si las métricas de rendimiento del modelo (ej: F1-score, AUC) caen por debajo de un umbral predefinido en los datos de producción.
Prueba de Integración de Modelo
Validación automatizada de la interacción correcta entre el modelo entrenado y otros componentes del sistema, como las API, las bases de datos y los servicios de monitoreo.
Shadow Testing
Técnica donde un nuevo modelo se despliega en paralelo del modelo de producción, recibiendo el mismo tráfico real pero sin impactar a los usuarios, para comparar sus desempeños antes del cambio.
Prueba de Replicación Experimental
Automatización que verifica la reproducibilidad de los resultados de un entrenamiento ejecutando el mismo pipeline con semillas aleatorias fijas, asegurando que las variaciones sean mínimas y controladas.
Canary Testing para Modelos ML
Estrategia de despliegue donde una nueva versión del modelo se expone a un bajo porcentaje del tráfico de usuario en producción, permitiendo una validación en condiciones reales antes de un despliegue completo.
Prueba de Dependencias de Pipeline
Validación automatizada de que todas las bibliotecas, versiones de software y recursos externos requeridos por el pipeline ML están presentes y son compatibles en el entorno de ejecución objetivo.