Glosario IA
El diccionario completo de la Inteligencia Artificial
Precisión de Robustez
Métrica que evalúa el rendimiento de un modelo sobre ejemplos adversarios generados dentro de un cierto límite de perturbación, midiendo así su resistencia a los ataques. Esta métrica combina la precisión clásica con una evaluación bajo restricciones de perturbación para cuantificar la degradación del rendimiento.
Distancia de Ataque
Medida cuantitativa de la perturbación mínima necesaria para que un ataque adversario logre engañar a un modelo, generalmente calculada según diferentes normas (L0, L1, L2, L∞). Esta métrica permite comparar la robustez relativa entre diferentes modelos frente a los mismos tipos de ataques.
Puntuación de Robustez
Índice compuesto normalizado entre 0 y 1 que evalúa globalmente la resistencia de un modelo frente a un conjunto variado de ataques adversarios. Esta puntuación agrega varias métricas de robustez para proporcionar una evaluación sintética de la seguridad del modelo.
Métrica CLEVER
Puntuación de estimación de la robustez local basada en los gradientes de Lipschitz, que permite evaluar un límite inferior en la resistencia de un modelo a los ataques sin necesidad de ataques específicos. CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) es particularmente eficaz para evaluar la robustez certificativa de las redes profundas.
Benchmark AutoAttack
Suite de evaluación estandarizada automatizada que combina múltiples ataques (APGD-CE, APGD-T, FAB, Square) para proporcionar una evaluación robusta y fiable de la resistencia de los modelos. AutoAttack adapta dinámicamente sus parámetros para maximizar la eficacia de los ataques y minimizar el enmascaramiento del gradiente.
Evaluación de Robustez Local
Análisis de la resistencia de un modelo en un vecindario específico alrededor de una muestra dada, determinando si la predicción permanece constante para todas las perturbaciones en esta región. Esta evaluación es crucial para comprender el comportamiento del modelo a nivel individual en lugar de agregado.
Evaluación de Robustez Global
Medida de la resistencia de un modelo en el conjunto de su distribución de entrada, evaluando su rendimiento promedio frente a los ataques en una amplia muestra de datos. Este enfoque proporciona una visión macroscópica de la seguridad del modelo en condiciones reales de uso.
Margen de Robustez
Distancia mínima entre la frontera de decisión de un modelo y una muestra de entrada, cuantificando el margen de seguridad antes de que se produzca un cambio de predicción. Esta métrica es fundamental para comprender la estabilidad geométrica de las decisiones del modelo.
Puntuación de Seguridad Adversaria
Indicador normalizado que evalúa el nivel de protección de un modelo contra diferentes familias de ataques adversariales, ponderando generalmente la severidad de los ataques por su probabilidad de ocurrencia. Esta puntuación ayuda a comparar objetivamente la seguridad relativa de diferentes arquitecturas de modelos.
Escala de Robustez
Sistema de clasificación estandarizado que permite categorizar los modelos según su nivel de resistencia a los ataques adversariales, generalmente dividido en varios niveles (bajo, medio, alto, certificado). Esta escala facilita la comunicación sobre la robustez de los modelos entre investigadores y profesionales.
Índice de Vulnerabilidad
Métrica cuantitativa que mide la sensibilidad de un modelo a los ataques adversariales, calculada como la relación entre el rendimiento degradado bajo ataque y el rendimiento nominal. Un índice alto indica una gran vulnerabilidad, mientras que un índice bajo sugiere una mejor resistencia.
Tasa de Éxito de Ataque
Porcentaje de muestras para las cuales un ataque adversarial logra cambiar la predicción del modelo, midiendo directamente la eficacia de los ataques contra un modelo dado. Esta métrica es complementaria a la precisión de robustez para evaluar completamente la seguridad del modelo.
Perturbación Máxima Admisible
Umbral de perturbación máximo que un modelo puede tolerar sin cambio de predicción, sirviendo como referencia para evaluar la robustez en condiciones controladas. Esta medida es esencial para definir las restricciones operacionales de seguridad del modelo.
Evaluación de Robustez Empírica
Metodología de evaluación basada en la generación de ataques adversariales específicos para probar la resistencia de un modelo, proporcionando medidas prácticas pero sin garantías formales. Este enfoque se utiliza ampliamente porque refleja escenarios de ataque reales.
Benchmark RobustBench
Plataforma estandarizada de referencia para la evaluación de la robustez de los modelos de clasificación de imágenes, proporcionando protocolos de evaluación estrictos y clasificaciones comparativas. RobustBench mantiene una lista de modelos robustos certificados y métricas de evaluación reconocidas por la comunidad.
Métrica de Distancia Lp
Norma matemática utilizada para cuantificar la amplitud de las perturbaciones adversariales, donde p puede tomar diferentes valores (0, 1, 2, ∞) para medir diferentes tipos de modificaciones. La elección de la norma Lp influye significativamente en la evaluación de la robustez según la naturaleza de las perturbaciones consideradas.
Evaluación de Robustez Formal
Enfoque matemáticamente riguroso para verificar la robustez de un modelo demostrando garantías sobre todas las perturbaciones posibles en un dominio especificado. A diferencia de los métodos empíricos, la evaluación formal proporciona certezas absolutas pero es a menudo computacionalmente costosa.