Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Attaque White-Box
Attaque où l'adversaire possède une connaissance complète de l'architecture du modèle, de ses paramètres et de ses poids, permettant une exploitation ciblée des vulnérabilités.
Fast Gradient Sign Method (FGSM)
Technique d'attaque white-box utilisant le gradient de la fonction de perte pour générer des perturbations adverses en une seule étape d'optimisation.
Attaque L-BFGS
Méthode d'attaque white-box basée sur l'algorithme d'optimisation BFGS limité en mémoire pour trouver des exemples adverses avec perturbation minimale.
DeepFool
Algorithme d'attaque white-box qui calcule la distance minimale à la frontière de décision en approximant linéairement le classifieur autour de l'échantillon.
Attaque Carlini-Wagner
Attaque white-box sophistiquée utilisant une optimisation non-linéaire pour générer des exemples adverses difficiles à détecter avec perturbations minimales.
Jacobian-based Saliency Map Attack (JSMA)
Attaque white-box exploitant la matrice jacobienne pour identifier les pixels les plus influents et créer des perturbations ciblées et imperceptibles.
Projected Gradient Descent (PGD)
Méthode d'attaque white-box itérative étendant FGSM avec de multiples étapes de descente de gradient et une projection pour contraindre les perturbations.
Analyse de sensibilité du modèle
Technique white-box évaluant comment les variations des entrées affectent les sorties du modèle pour identifier les points de vulnérabilité exploitables.
Perturbation optimale Lp
Problème d'optimisation white-box cherchant la plus petite perturbation selon une norme Lp (L0, L2 ou L∞) pour tromper le classifieur.
Attaque par extraction de modèle
Attaque white-box où l'adversaire accède aux paramètres internes pour répliquer ou voler la fonctionnalité complète du modèle entraîné.
Backdoor dans modèle white-box
Vulnérabilité introduite intentionnellement dans un modèle accessible en white-box, activable par des déclencheurs spécifiques connus de l'attaquant.
Attaque par inversion de gradient
Attaque white-box reconstruct les données d'entraînement originales en inversant les gradients du modèle, compromettant la confidentialité des données.
Méthode d'Evasion complète
Stratégie d'attaque white-box exploitant toutes les connaissances du modèle pour créer des exemples adverses garantissant le contournement du classifieur.
Attaque par Membership Inference
Attaque white-box déterminant si un échantillon spécifique faisait partie des données d'entraînement en analysant les réponses détaillées du modèle.
Perturbation universelle white-box
Perturbation unique générée en white-box capable de tromper le modèle sur une large gamme d'entrées grâce à la connaissance complète du classifieur.