KI-Glossar
Das vollständige Wörterbuch der Künstlichen Intelligenz
Attaque Adversariale
Technique consistant à introduire des perturbations imperceptibles dans les données d'entrée pour tromper un modèle d'apprentissage automatique. Ces attaques exploitent les vulnérabilités des réseaux de neurones profonds en manipulant subtilement les pixels d'une image.
Attaque par Patch Adversarial
Technique d'attaque où un patch physique ou numérique est appliqué à une image pour tromper les modèles de classification ou de détection. Contrairement aux perturbations de pixels, cette méthode modifie une région spécifique de l'image de manière visible mais interprétée incorrectement par le modèle.
Attaque Universelle
Type d'attaque où une seule perturbation est capable de tromper un modèle sur la majorité des images d'entrée. Ces attaques sont particulièrement dangereuses car elles ne nécessitent pas de recalculer la perturbation pour chaque nouvelle image.
Attaque sur Détection d'Objets
Attaque spécifiquement conçue pour tromper les modèles de détection d'objets en manipulant les bounding boxes ou les scores de confiance. Ces attaques peuvent faire disparaître des objets détectés ou en faire apparaître de faux.
Gradient Masqué
Phénomène où un modèle de défense artificiellement lisse sa surface de décision, rendant les gradients inutilisables pour les attaques. Bien que semblant protecteur, cette technique est souvent contournable et peut créer une fausse impression de sécurité.
Perturbation Lp
Mesure de la magnitude des perturbations adversariales utilisant différentes normes mathématiques (L0, L2, Linfini). Chaque norme impose différentes contraintes sur la nature et la distribution des modifications autorisées dans l'image.
Attaque sur Segmentation Sémantique
Attaque ciblant les modèles de segmentation qui modifient la classification pixel par pixel des images. Ces attaques peuvent altérer la perception des contours et des régions sémantiques, affectant des applications comme la conduite autonome ou l'imagerie médicale.
Transferabilité d'Attaque
Phénomène où une attaque générée contre un modèle spécifique reste efficace contre d'autres modèles, même avec des architectures différentes. Cette propriété est cruciale pour les attaques par boîte noire et révèle des vulnérabilités communes entre modèles.