Attaques par Extraction de Modèle

📖

termes

Vol de Paramètres

Processus par lequel un attaquant récupère les poids et biais d'un réseau neuronal entraîné pour recréer une copie fonctionnelle du modèle original sans accès direct aux fichiers.

📖

termes

Extraction de Fonctionnalité

Méthode consistant à déduire les caractéristiques d'apprentissage et les représentations internes d'un modèle en observant ses comportements face à diverses entrées.

📖

termes

Requêtes Adversariales

Ensemble d'entrées spécifiquement conçues pour sonder les limites et comportements d'un modèle dans le but d'en extraire des informations sensibles sur son architecture ou ses paramètres.

📖

termes

Inférence de Modèle

Processus de déduction des propriétés d'un modèle cible (architecture, hyperparamètres, données d'entraînement) à partir de ses prédictions et réponses aux requêtes.

📖

termes

Shadow Modeling

Technique où l'attaquant entraîne plusieurs modèles substituts pour approximer le comportement du modèle cible, facilitant ensuite l'extraction de ses caractéristiques internes.

📖

termes

Membership Inference

Attaque visant à déterminer si un échantillon de données spécifique faisait partie de l'ensemble d'entraînement d'un modèle, souvent utilisée comme étape préliminaire à l'extraction.

📖

termes

Query-Based Attack

Stratégie d'attaque reposant exclusivement sur l'envoi de requêtes à l'API d'un modèle pour en déduire progressivement sa structure et ses paramètres internes.

📖

termes

Function Extraction Attack

Attaque spécialisée visant à reproduire la fonction de décision d'un modèle plutôt que ses paramètres exacts, en créant un modèle approximatif avec un comportement équivalent.

📖

termes

Parameter Extraction

Technique avancée permettant de récupérer les valeurs numériques exactes des poids d'un réseau neuronal à partir d'observations de ses sorties pour différentes entrées.

📖

termes

API Abuse

Exploitation abusive des points d'accès d'un service d'IA pour effectuer un nombre excessif de requêtes dans le but d'extraire des informations sur le modèle sous-jacent.

📖

termes

Model Inversion

Attaque reconstructive où l'attaquant utilise les sorties d'un modèle pour reconstruire approximativement les données d'entraînement sensibles ayant servi à son apprentissage.

📖

termes

Knowledge Distillation Attack

Utilisation malveillante des techniques de distillation de connaissances où le modèle cible devient l'enseignant et l'attaquant crée un modèle élève qui imite son comportement.

📖

termes

Model Fingerprinting

Identification unique d'un modèle par ses caractéristiques comportementales distinctives, permettant de tracer sa provenance et de faciliter son extraction ciblée.

📖

termes

White-box Extraction

Attaque où l'attaquant a un accès partiel ou complet à l'architecture du modèle, facilitant grandement l'extraction précise de ses paramètres et fonctionnalités.

📖

termes

Black-box Extraction

Extraction de modèle effectuée sans connaissance préalable de l'architecture interne, en se basant uniquement sur les relations entrées-sorties observées via l'API.

📖

termes

Oracle Attack

Méthode d'attaque traitant le modèle cible comme un oracle fournissant des réponses à des questions, utilisant ces réponses pour reconstruire progressivement sa logique interne.

📖

termes

Output Space Analysis

Analyse systématique de l'espace des sorties d'un modèle pour identifier des patterns et relations permettant de déduire sa structure interne et ses paramètres.

Glossaire IA

Vol de Paramètres

Extraction de Fonctionnalité

Requêtes Adversariales

Inférence de Modèle

Shadow Modeling

Membership Inference

Query-Based Attack

Function Extraction Attack

Parameter Extraction

API Abuse

Model Inversion

Knowledge Distillation Attack

Model Fingerprinting

White-box Extraction

Black-box Extraction

Oracle Attack

Output Space Analysis

Aucun résultat trouvé