Defensa por enmascaramiento de gradientes

📖

términos

Destilación defensiva

Método de defensa que entrena una red para aprender las probabilidades suaves de un modelo preentrenado, reduciendo la sensibilidad a las perturbaciones adversarias alisando la superficie de decisión.

📖

términos

Gradientes ofuscados

Fenómeno donde las defensas enmascaran intencional o accidentalmente los gradientes, creando una falsa impresión de robustez mientras siguen siendo vulnerables a ataques alternativos.

📖

términos

Fragmentación de gradientes

Técnica que introduce discontinuidades u oscilaciones en el paisaje de gradientes para perturbar los métodos de ataque basados en la optimización iterativa.

📖

términos

Regularización de gradientes

Enfoque que penaliza los gradientes altos durante el entrenamiento para reducir la sensibilidad del modelo a pequeñas perturbaciones de entrada y mejorar la robustez general.

📖

términos

Suavizado aleatorio

Método que certifica la robustez añadiendo ruido aleatorio a las entradas y utilizando técnicas de suavizado gaussiano para garantizar límites de certificabilidad contra los ataques adversarios.

📖

términos

Transformación de entrada

Defensa que aplica transformaciones no diferenciables o invertibles a las entradas antes de la clasificación, como la compresión o el remuestreo, para neutralizar las perturbaciones adversarias.

📖

términos

Reducción de características

Técnica que reduce la complejidad de las características de entrada disminuyendo la precisión de los píxeles o el espacio de color, eliminando así las perturbaciones imperceptibles utilizadas en los ataques.

📖

términos

Defensa no diferenciable

Estrategia de protección que integra operaciones no diferenciables en el canal de clasificación para impedir el cálculo eficiente de gradientes por parte de los atacantes.

📖

términos

Ofuscación de gradiente

Conjunto de técnicas que hacen que los gradientes sean inutilizables por métodos numéricos, incluyendo el enmascaramiento, aplastamiento o falsificación de la información del gradiente.

📖

términos

Defensas certificadas

Enfoques que proporcionan garantías matemáticas comprobables sobre la robustez del modelo dentro de un radio de perturbación especificado, evitando las falsas impresiones de seguridad.

📖

términos

Defensa contra ataques de mapas de saliencia basados en el Jacobiano

Contramedidas diseñadas específicamente para neutralizar los ataques basados en mapas de saliencia jacobianos modificando la estructura de la red o los mecanismos de propagación.

📖

términos

Robustez basada en PGD

Evaluación y mejora de la robustez utilizando el Descenso de Gradiente Proyectado como ataque de referencia para medir y optimizar la resistencia del modelo.

📖

términos

Métodos de conjunto

Uso de múltiples modelos con diferentes arquitecturas o inicializaciones para diversificar las respuestas y reducir la eficacia de los ataques que tienen como objetivo un único punto débil.

📖

términos

Continuidad de Lipschitz

Propiedad matemática que garantiza una variación limitada de las salidas con respecto a las entradas, utilizada para diseñar redes intrínsecamente robustas a las perturbaciones.

📖

términos

Redes robustas comprobables

Arquitecturas neuronales diseñadas con restricciones formales que garantizan matemáticamente su robustez en condiciones de perturbación especificadas.

📖

términos

Ataques de optimización sin gradiente

Métodos de ataque que evitan el enmascaramiento de gradiente utilizando enfoques de optimización sin gradiente como los algoritmos genéticos o el recocido simulado.

📖

términos

Codificación de termómetro

Técnica de codificación de entradas que transforma las características continuas en representaciones binarias ordenadas, reduciendo el espacio de ataque y mejorando la robustez.

Glosario IA

Destilación defensiva

Gradientes ofuscados

Fragmentación de gradientes

Regularización de gradientes

Suavizado aleatorio

Transformación de entrada

Reducción de características

Defensa no diferenciable

Ofuscación de gradiente

Defensas certificadas

Defensa contra ataques de mapas de saliencia basados en el Jacobiano

Robustez basada en PGD

Métodos de conjunto

Continuidad de Lipschitz

Redes robustas comprobables

Ataques de optimización sin gradiente

Codificación de termómetro

No se encontraron resultados