Évaluation de Robustesse

📖

termes

Accuracy Robustesse

Métrique évaluant la performance d'un modèle sur des exemples adversariaux générés dans une certaine borne de perturbation, mesurant ainsi sa résistance aux attaques. Cette métrique combine la précision classique avec une évaluation sous contraintes de perturbation pour quantifier la dégradation des performances.

📖

termes

Distance d'Attaque

Mesure quantitative de la perturbation minimale nécessaire pour qu'une attaque adversariale réussisse à tromper un modèle, généralement calculée selon différentes normes (L0, L1, L2, L∞). Cette métrique permet de comparer la robustesse relative entre différents modèles face aux mêmes types d'attaques.

📖

termes

Score de Robustesse

Indice composite normalisé entre 0 et 1 évaluant globalement la résistance d'un modèle face à un ensemble varié d'attaques adversariales. Ce score agrège plusieurs métriques de robustesse pour fournir une évaluation synthétique de la sécurité du modèle.

📖

termes

Métrique CLEVER

Score d'estimation de la robustesse locale basé sur les gradients Lipschitz, permettant d'évaluer une borne inférieure sur la résistance d'un modèle aux attaques sans nécessiter d'attaques spécifiques. CLEVER (Cross Lipschitz Extreme Value for nEtwork Robustness) est particulièrement efficace pour évaluer la robustesse certificative des réseaux profonds.

📖

termes

Benchmark AutoAttack

Suite d'évaluation standardisée automatisée combinant multiple attaques (APGD-CE, APGD-T, FAB, Square) pour fournir une évaluation robuste et fiable de la résistance des modèles. AutoAttack adapte dynamiquement ses paramètres pour maximiser l'efficacité des attaques et minimiser le gradient masking.

📖

termes

Évaluation de Robustesse Locale

Analyse de la résistance d'un modèle dans un voisinage spécifique autour d'un échantillon donné, déterminant si la prédiction reste constante pour toutes les perturbations dans cette région. Cette évaluation est cruciale pour comprendre le comportement du modèle au niveau individuel plutôt qu'agrégré.

📖

termes

Évaluation de Robustesse Globale

Mesure de la résistance d'un modèle sur l'ensemble de sa distribution d'entrée, évaluant sa performance moyenne face aux attaques sur un large échantillon de données. Cette approche fournit une vision macroscopique de la sécurité du modèle dans des conditions réelles d'utilisation.

📖

termes

Marge de Robustesse

Distance minimale entre la frontière de décision d'un modèle et un échantillon d'entrée, quantifiant la marge de sécurité avant qu'un changement de prédiction ne se produise. Cette métrique est fondamentale pour comprendre la stabilité géométrique des décisions du modèle.

📖

termes

Score de Sécurité Adversarial

Indicateur normalisé évaluant le niveau de protection d'un modèle contre différentes familles d'attaques adversariales, pondérant généralement la sévérité des attaques par leur probabilité d'occurrence. Ce score aide à comparer objectivement la sécurité relative de différentes architectures de modèles.

📖

termes

Échelle de Robustesse

Système de classification standardisé permettant de catégoriser les modèles selon leur niveau de résistance aux attaques adversariales, généralement divisé en plusieurs niveaux (bas, moyen, élevé, certifié). Cette échelle facilite la communication sur la robustesse des modèles entre chercheurs et praticiens.

📖

termes

Indice de Vulnérabilité

Métrique quantitative mesurant la sensibilité d'un modèle aux attaques adversariales, calculée comme le rapport entre la performance dégradée sous attaque et la performance nominale. Un indice élevé indique une grande vulnérabilité tandis qu'un indice faible suggère une meilleure résistance.

📖

termes

Taux de Succès d'Attaque

Pourcentage d'échantillons pour lesquels une attaque adversariale parvient à changer la prédiction du modèle, mesurant directement l'efficacité des attaques contre un modèle donné. Cette métrique est complémentaire à l'accuracy robustesse pour évaluer complètement la sécurité du modèle.

📖

termes

Perturbation Maximale Admissible

Seuil de perturbation maximal qu'un modèle peut tolérer sans changement de prédiction, servant de référence pour évaluer la robustesse dans des conditions contrôlées. Cette mesure est essentielle pour définir les contraintes opérationnelles de sécurité du modèle.

📖

termes

Évaluation de Robustesse Empirique

Méthodologie d'évaluation basée sur la génération d'attaques adversariales spécifiques pour tester la résistance d'un modèle, fournissant des mesures pratiques mais sans garanties formelles. Cette approche est largement utilisée car elle reflète les scénarios d'attaque réels.

📖

termes

Benchmark RobustBench

Plateforme standardisée de référence pour l'évaluation de la robustesse des modèles de classification d'images, fournissant des protocoles d'évaluation stricts et des classements comparatifs. RobustBench maintient une liste de modèles certifiés robustes et des métriques d'évaluation reconnues par la communauté.

📖

termes

Métrique de Distance Lp

Norme mathématique utilisée pour quantifier l'amplitude des perturbations adversariales, où p peut prendre différentes valeurs (0, 1, 2, ∞) pour mesurer différents types de modifications. Le choix de la norme Lp influence significativement l'évaluation de la robustesse selon la nature des perturbations considérées.

📖

termes

Évaluation de Robustesse Formelle

Approche mathématiquement rigoureuse pour vérifier la robustesse d'un modèle en prouvant des garanties sur toutes les perturbations possibles dans un domaine spécifié. Contrairement aux méthodes empiriques, l'évaluation formelle fournit des certitudes absolues mais est souvent computablemen coûteuse.

Glossaire IA

Accuracy Robustesse

Distance d'Attaque

Score de Robustesse

Métrique CLEVER

Benchmark AutoAttack

Évaluation de Robustesse Locale

Évaluation de Robustesse Globale

Marge de Robustesse

Score de Sécurité Adversarial

Échelle de Robustesse

Indice de Vulnérabilité

Taux de Succès d'Attaque

Perturbation Maximale Admissible

Évaluation de Robustesse Empirique

Benchmark RobustBench

Métrique de Distance Lp

Évaluation de Robustesse Formelle

Aucun résultat trouvé