Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Accuracy Robustesse
Métrique évaluant la performance d'un modèle sur des exemples adversariaux générés dans une certaine borne de perturbation, mesurant ainsi sa résistance aux attaques. Cette métrique combine la précision classique avec une évaluation sous contraintes de perturbation pour quantifier la dégradation des performances.
Distance d'Attaque
Mesure quantitative de la perturbation minimale nécessaire pour qu'une attaque adversariale réussisse à tromper un modèle, généralement calculée selon différentes normes (L0, L1, L2, L∞). Cette métrique permet de comparer la robustesse relative entre différents modèles face aux mêmes types d'attaques.
Score de Robustesse
Indice composite normalisé entre 0 et 1 évaluant globalement la résistance d'un modèle face à un ensemble varié d'attaques adversariales. Ce score agrège plusieurs métriques de robustesse pour fournir une évaluation synthétique de la sécurité du modèle.
Métrique CLEVER
Score d'estimation de la robustesse locale basé sur les gradients Lipschitz, permettant d'évaluer une borne inférieure sur la résistance d'un modèle aux attaques sans nécessiter d'attaques spécifiques. CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) est particulièrement efficace pour évaluer la robustesse certificative des réseaux profonds.
Benchmark AutoAttack
Suite d'évaluation standardisée automatisée combinant multiple attaques (APGD-CE, APGD-T, FAB, Square) pour fournir une évaluation robuste et fiable de la résistance des modèles. AutoAttack adapte dynamiquement ses paramètres pour maximiser l'efficacité des attaques et minimiser le gradient masking.
Évaluation de Robustesse Locale
Analyse de la résistance d'un modèle dans un voisinage spécifique autour d'un échantillon donné, déterminant si la prédiction reste constante pour toutes les perturbations dans cette région. Cette évaluation est cruciale pour comprendre le comportement du modèle au niveau individuel plutôt qu'agrégré.
Évaluation de Robustesse Globale
Mesure de la résistance d'un modèle sur l'ensemble de sa distribution d'entrée, évaluant sa performance moyenne face aux attaques sur un large échantillon de données. Cette approche fournit une vision macroscopique de la sécurité du modèle dans des conditions réelles d'utilisation.
Marge de Robustesse
Distance minimale entre la frontière de décision d'un modèle et un échantillon d'entrée, quantifiant la marge de sécurité avant qu'un changement de prédiction ne se produise. Cette métrique est fondamentale pour comprendre la stabilité géométrique des décisions du modèle.
Score de Sécurité Adversarial
Indicateur normalisé évaluant le niveau de protection d'un modèle contre différentes familles d'attaques adversariales, pondérant généralement la sévérité des attaques par leur probabilité d'occurrence. Ce score aide à comparer objectivement la sécurité relative de différentes architectures de modèles.
Échelle de Robustesse
Système de classification standardisé permettant de catégoriser les modèles selon leur niveau de résistance aux attaques adversariales, généralement divisé en plusieurs niveaux (bas, moyen, élevé, certifié). Cette échelle facilite la communication sur la robustesse des modèles entre chercheurs et praticiens.
Indice de Vulnérabilité
Métrique quantitative mesurant la sensibilité d'un modèle aux attaques adversariales, calculée comme le rapport entre la performance dégradée sous attaque et la performance nominale. Un indice élevé indique une grande vulnérabilité tandis qu'un indice faible suggère une meilleure résistance.
Taux de Succès d'Attaque
Pourcentage d'échantillons pour lesquels une attaque adversariale parvient à changer la prédiction du modèle, mesurant directement l'efficacité des attaques contre un modèle donné. Cette métrique est complémentaire à l'accuracy robustesse pour évaluer complètement la sécurité du modèle.
Perturbation Maximale Admissible
Seuil de perturbation maximal qu'un modèle peut tolérer sans changement de prédiction, servant de référence pour évaluer la robustesse dans des conditions contrôlées. Cette mesure est essentielle pour définir les contraintes opérationnelles de sécurité du modèle.
Évaluation de Robustesse Empirique
Méthodologie d'évaluation basée sur la génération d'attaques adversariales spécifiques pour tester la résistance d'un modèle, fournissant des mesures pratiques mais sans garanties formelles. Cette approche est largement utilisée car elle reflète les scénarios d'attaque réels.
Benchmark RobustBench
Plateforme standardisée de référence pour l'évaluation de la robustesse des modèles de classification d'images, fournissant des protocoles d'évaluation stricts et des classements comparatifs. RobustBench maintient une liste de modèles certifiés robustes et des métriques d'évaluation reconnues par la communauté.
Métrique de Distance Lp
Norme mathématique utilisée pour quantifier l'amplitude des perturbations adversariales, où p peut prendre différentes valeurs (0, 1, 2, ∞) pour mesurer différents types de modifications. Le choix de la norme Lp influence significativement l'évaluation de la robustesse selon la nature des perturbations considérées.
Évaluation de Robustesse Formelle
Approche mathématiquement rigoureuse pour vérifier la robustesse d'un modèle en prouvant des garanties sur toutes les perturbations possibles dans un domaine spécifié. Contrairement aux méthodes empiriques, l'évaluation formelle fournit des certitudes absolues mais est souvent computablemen coûteuse.