Evaluación de Robustez

📖

términos

Precisión de Robustez

Métrica que evalúa el rendimiento de un modelo sobre ejemplos adversarios generados dentro de un cierto límite de perturbación, midiendo así su resistencia a los ataques. Esta métrica combina la precisión clásica con una evaluación bajo restricciones de perturbación para cuantificar la degradación del rendimiento.

📖

términos

Distancia de Ataque

Medida cuantitativa de la perturbación mínima necesaria para que un ataque adversario logre engañar a un modelo, generalmente calculada según diferentes normas (L0, L1, L2, L∞). Esta métrica permite comparar la robustez relativa entre diferentes modelos frente a los mismos tipos de ataques.

📖

términos

Puntuación de Robustez

Índice compuesto normalizado entre 0 y 1 que evalúa globalmente la resistencia de un modelo frente a un conjunto variado de ataques adversarios. Esta puntuación agrega varias métricas de robustez para proporcionar una evaluación sintética de la seguridad del modelo.

📖

términos

Métrica CLEVER

Puntuación de estimación de la robustez local basada en los gradientes de Lipschitz, que permite evaluar un límite inferior en la resistencia de un modelo a los ataques sin necesidad de ataques específicos. CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) es particularmente eficaz para evaluar la robustez certificativa de las redes profundas.

📖

términos

Benchmark AutoAttack

Suite de evaluación estandarizada automatizada que combina múltiples ataques (APGD-CE, APGD-T, FAB, Square) para proporcionar una evaluación robusta y fiable de la resistencia de los modelos. AutoAttack adapta dinámicamente sus parámetros para maximizar la eficacia de los ataques y minimizar el enmascaramiento del gradiente.

📖

términos

Evaluación de Robustez Local

Análisis de la resistencia de un modelo en un vecindario específico alrededor de una muestra dada, determinando si la predicción permanece constante para todas las perturbaciones en esta región. Esta evaluación es crucial para comprender el comportamiento del modelo a nivel individual en lugar de agregado.

📖

términos

Evaluación de Robustez Global

Medida de la resistencia de un modelo en el conjunto de su distribución de entrada, evaluando su rendimiento promedio frente a los ataques en una amplia muestra de datos. Este enfoque proporciona una visión macroscópica de la seguridad del modelo en condiciones reales de uso.

📖

términos

Margen de Robustez

Distancia mínima entre la frontera de decisión de un modelo y una muestra de entrada, cuantificando el margen de seguridad antes de que se produzca un cambio de predicción. Esta métrica es fundamental para comprender la estabilidad geométrica de las decisiones del modelo.

📖

términos

Puntuación de Seguridad Adversaria

Indicador normalizado que evalúa el nivel de protección de un modelo contra diferentes familias de ataques adversariales, ponderando generalmente la severidad de los ataques por su probabilidad de ocurrencia. Esta puntuación ayuda a comparar objetivamente la seguridad relativa de diferentes arquitecturas de modelos.

📖

términos

Escala de Robustez

Sistema de clasificación estandarizado que permite categorizar los modelos según su nivel de resistencia a los ataques adversariales, generalmente dividido en varios niveles (bajo, medio, alto, certificado). Esta escala facilita la comunicación sobre la robustez de los modelos entre investigadores y profesionales.

📖

términos

Índice de Vulnerabilidad

Métrica cuantitativa que mide la sensibilidad de un modelo a los ataques adversariales, calculada como la relación entre el rendimiento degradado bajo ataque y el rendimiento nominal. Un índice alto indica una gran vulnerabilidad, mientras que un índice bajo sugiere una mejor resistencia.

📖

términos

Tasa de Éxito de Ataque

Porcentaje de muestras para las cuales un ataque adversarial logra cambiar la predicción del modelo, midiendo directamente la eficacia de los ataques contra un modelo dado. Esta métrica es complementaria a la precisión de robustez para evaluar completamente la seguridad del modelo.

📖

términos

Perturbación Máxima Admisible

Umbral de perturbación máximo que un modelo puede tolerar sin cambio de predicción, sirviendo como referencia para evaluar la robustez en condiciones controladas. Esta medida es esencial para definir las restricciones operacionales de seguridad del modelo.

📖

términos

Evaluación de Robustez Empírica

Metodología de evaluación basada en la generación de ataques adversariales específicos para probar la resistencia de un modelo, proporcionando medidas prácticas pero sin garantías formales. Este enfoque se utiliza ampliamente porque refleja escenarios de ataque reales.

📖

términos

Benchmark RobustBench

Plataforma estandarizada de referencia para la evaluación de la robustez de los modelos de clasificación de imágenes, proporcionando protocolos de evaluación estrictos y clasificaciones comparativas. RobustBench mantiene una lista de modelos robustos certificados y métricas de evaluación reconocidas por la comunidad.

📖

términos

Métrica de Distancia Lp

Norma matemática utilizada para cuantificar la amplitud de las perturbaciones adversariales, donde p puede tomar diferentes valores (0, 1, 2, ∞) para medir diferentes tipos de modificaciones. La elección de la norma Lp influye significativamente en la evaluación de la robustez según la naturaleza de las perturbaciones consideradas.

📖

términos

Evaluación de Robustez Formal

Enfoque matemáticamente riguroso para verificar la robustez de un modelo demostrando garantías sobre todas las perturbaciones posibles en un dominio especificado. A diferencia de los métodos empíricos, la evaluación formal proporciona certezas absolutas pero es a menudo computacionalmente costosa.

Glosario IA

Precisión de Robustez

Distancia de Ataque

Puntuación de Robustez

Métrica CLEVER

Benchmark AutoAttack

Evaluación de Robustez Local

Evaluación de Robustez Global

Margen de Robustez

Puntuación de Seguridad Adversaria

Escala de Robustez

Índice de Vulnerabilidad

Tasa de Éxito de Ataque

Perturbación Máxima Admisible

Evaluación de Robustez Empírica

Benchmark RobustBench

Métrica de Distancia Lp

Evaluación de Robustez Formal

No se encontraron resultados