AI 词汇表
人工智能完整词典
迁移鲁棒性
模型抵抗最初为其他架构设计的对抗攻击的能力,衡量防御措施对未知威胁的泛化能力。
源模型
在迁移攻击背景下用于生成对抗攻击的参考模型,作为攻击目标模型的起点。
目标模型
迁移攻击所针对的受害模型,其漏洞通过在独立源模型上生成的扰动被利用。
攻击空间
定义所有可能应用于输入数据以破坏模型的扰动的数学域,对评估攻击的可迁移性至关重要。
攻击泛化
对抗攻击在多个模型或同一模型的不同实例上保持其有效性的特性,与其特定架构或参数无关。
集成方法
结合多个源模型生成更鲁棒和可迁移扰动的攻击策略,显著提高对未知目标的成功率。
无盒攻击
一种极端的迁移攻击类型,攻击者完全不掌握目标模型的任何信息,仅依赖扰动的通用可迁移性。
范数距离
量化对抗扰动幅度的数学度量(L0、L1、L2、L∞),对评估可迁移性同时保持攻击不可感知性至关重要。
Borne de Transférabilité
Limite théorique supérieure quantifiant le taux de succès maximal d'une attaque par transfert entre deux modèles, basée sur leurs similarités structurelles et fonctionnelles.
Diversité de Modèles
Mesure de variation entre architectures, paramètres et ensembles de données d'entraînement de différents modèles, influençant directement la transférabilité des attaques adversariales.
Alignement de Gradients
Similarité directionnelle entre les gradients de différents modèles, servant d'indicateur prédictif de la transférabilité potentielle des attaques entre ces modèles.
Défense par Transfert
Approche défensive exploitant la transférabilité des attaques pour développer des protections robustes fonctionnant contre des menaces inconnues et futures modèles d'attaque.
Evasion de Modèle
Objectif des attaques par transfert consistant à contourner les mécanismes de détection ou classification d'un modèle sans être détecté, en exploitant ses faiblesses généralisées.
Surface de Décision
Frontière mathématique séparant les différentes classes de prédiction d'un modèle, dont la similarité entre modèles détermine le succès potentiel des attaques par transfert.
Sensibilité par Transfert
Mesure quantitative de la vulnérabilité partagée entre différents modèles face aux mêmes perturbations adversariales, révélatrice de faiblesses systémiques dans l'apprentissage automatique.
Métrique de Transférabilité
Indicateur quantitatif évaluant la probabilité de succès d'une attaque générée sur un modèle source à compromettre un modèle cible, basé sur des similarités structurelles ou comportementales.