Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Vol de Paramètres
Processus par lequel un attaquant récupère les poids et biais d'un réseau neuronal entraîné pour recréer une copie fonctionnelle du modèle original sans accès direct aux fichiers.
Extraction de Fonctionnalité
Méthode consistant à déduire les caractéristiques d'apprentissage et les représentations internes d'un modèle en observant ses comportements face à diverses entrées.
Requêtes Adversariales
Ensemble d'entrées spécifiquement conçues pour sonder les limites et comportements d'un modèle dans le but d'en extraire des informations sensibles sur son architecture ou ses paramètres.
Inférence de Modèle
Processus de déduction des propriétés d'un modèle cible (architecture, hyperparamètres, données d'entraînement) à partir de ses prédictions et réponses aux requêtes.
Shadow Modeling
Technique où l'attaquant entraîne plusieurs modèles substituts pour approximer le comportement du modèle cible, facilitant ensuite l'extraction de ses caractéristiques internes.
Membership Inference
Attaque visant à déterminer si un échantillon de données spécifique faisait partie de l'ensemble d'entraînement d'un modèle, souvent utilisée comme étape préliminaire à l'extraction.
Query-Based Attack
Stratégie d'attaque reposant exclusivement sur l'envoi de requêtes à l'API d'un modèle pour en déduire progressivement sa structure et ses paramètres internes.
Function Extraction Attack
Attaque spécialisée visant à reproduire la fonction de décision d'un modèle plutôt que ses paramètres exacts, en créant un modèle approximatif avec un comportement équivalent.
Parameter Extraction
Technique avancée permettant de récupérer les valeurs numériques exactes des poids d'un réseau neuronal à partir d'observations de ses sorties pour différentes entrées.
API Abuse
Exploitation abusive des points d'accès d'un service d'IA pour effectuer un nombre excessif de requêtes dans le but d'extraire des informations sur le modèle sous-jacent.
Model Inversion
Attaque reconstructive où l'attaquant utilise les sorties d'un modèle pour reconstruire approximativement les données d'entraînement sensibles ayant servi à son apprentissage.
Knowledge Distillation Attack
Utilisation malveillante des techniques de distillation de connaissances où le modèle cible devient l'enseignant et l'attaquant crée un modèle élève qui imite son comportement.
Model Fingerprinting
Identification unique d'un modèle par ses caractéristiques comportementales distinctives, permettant de tracer sa provenance et de faciliter son extraction ciblée.
White-box Extraction
Attaque où l'attaquant a un accès partiel ou complet à l'architecture du modèle, facilitant grandement l'extraction précise de ses paramètres et fonctionnalités.
Black-box Extraction
Extraction de modèle effectuée sans connaissance préalable de l'architecture interne, en se basant uniquement sur les relations entrées-sorties observées via l'API.
Oracle Attack
Méthode d'attaque traitant le modèle cible comme un oracle fournissant des réponses à des questions, utilisant ces réponses pour reconstruire progressivement sa logique interne.
Output Space Analysis
Analyse systématique de l'espace des sorties d'un modèle pour identifier des patterns et relations permettant de déduire sa structure interne et ses paramètres.