Attaques White-Box - Glossaire IA

📖

termes

Attaque White-Box

Attaque où l'adversaire possède une connaissance complète de l'architecture du modèle, de ses paramètres et de ses poids, permettant une exploitation ciblée des vulnérabilités.

📖

termes

Fast Gradient Sign Method (FGSM)

Technique d'attaque white-box utilisant le gradient de la fonction de perte pour générer des perturbations adverses en une seule étape d'optimisation.

📖

termes

Attaque L-BFGS

Méthode d'attaque white-box basée sur l'algorithme d'optimisation BFGS limité en mémoire pour trouver des exemples adverses avec perturbation minimale.

📖

termes

DeepFool

Algorithme d'attaque white-box qui calcule la distance minimale à la frontière de décision en approximant linéairement le classifieur autour de l'échantillon.

📖

termes

Attaque Carlini-Wagner

Attaque white-box sophistiquée utilisant une optimisation non-linéaire pour générer des exemples adverses difficiles à détecter avec perturbations minimales.

📖

termes

Jacobian-based Saliency Map Attack (JSMA)

Attaque white-box exploitant la matrice jacobienne pour identifier les pixels les plus influents et créer des perturbations ciblées et imperceptibles.

📖

termes

Projected Gradient Descent (PGD)

Méthode d'attaque white-box itérative étendant FGSM avec de multiples étapes de descente de gradient et une projection pour contraindre les perturbations.

📖

termes

Analyse de sensibilité du modèle

Technique white-box évaluant comment les variations des entrées affectent les sorties du modèle pour identifier les points de vulnérabilité exploitables.

📖

termes

Perturbation optimale Lp

Problème d'optimisation white-box cherchant la plus petite perturbation selon une norme Lp (L0, L2 ou L∞) pour tromper le classifieur.

📖

termes

Attaque par extraction de modèle

Attaque white-box où l'adversaire accède aux paramètres internes pour répliquer ou voler la fonctionnalité complète du modèle entraîné.

📖

termes

Backdoor dans modèle white-box

Vulnérabilité introduite intentionnellement dans un modèle accessible en white-box, activable par des déclencheurs spécifiques connus de l'attaquant.

📖

termes

Attaque par inversion de gradient

Attaque white-box reconstruct les données d'entraînement originales en inversant les gradients du modèle, compromettant la confidentialité des données.

📖

termes

Méthode d'Evasion complète

Stratégie d'attaque white-box exploitant toutes les connaissances du modèle pour créer des exemples adverses garantissant le contournement du classifieur.

📖

termes

Attaque par Membership Inference

Attaque white-box déterminant si un échantillon spécifique faisait partie des données d'entraînement en analysant les réponses détaillées du modèle.

📖

termes

Perturbation universelle white-box

Perturbation unique générée en white-box capable de tromper le modèle sur une large gamme d'entrées grâce à la connaissance complète du classifieur.

Glossaire IA

Attaque White-Box

Fast Gradient Sign Method (FGSM)

Attaque L-BFGS

DeepFool

Attaque Carlini-Wagner

Jacobian-based Saliency Map Attack (JSMA)

Projected Gradient Descent (PGD)

Analyse de sensibilité du modèle

Perturbation optimale Lp

Attaque par extraction de modèle

Backdoor dans modèle white-box

Attaque par inversion de gradient

Méthode d'Evasion complète

Attaque par Membership Inference

Perturbation universelle white-box

Aucun résultat trouvé