Model Extraction Attacks

📖

termini

Vol de Paramètres

Processus par lequel un attaquant récupère les poids et biais d'un réseau neuronal entraîné pour recréer une copie fonctionnelle du modèle original sans accès direct aux fichiers.

📖

termini

Extraction de Fonctionnalité

Méthode consistant à déduire les caractéristiques d'apprentissage et les représentations internes d'un modèle en observant ses comportements face à diverses entrées.

📖

termini

Requêtes Adversariales

Ensemble d'entrées spécifiquement conçues pour sonder les limites et comportements d'un modèle dans le but d'en extraire des informations sensibles sur son architecture ou ses paramètres.

📖

termini

Inférence de Modèle

Processus de déduction des propriétés d'un modèle cible (architecture, hyperparamètres, données d'entraînement) à partir de ses prédictions et réponses aux requêtes.

📖

termini

Shadow Modeling

Technique où l'attaquant entraîne plusieurs modèles substituts pour approximer le comportement du modèle cible, facilitant ensuite l'extraction de ses caractéristiques internes.

📖

termini

Membership Inference

Attaque visant à déterminer si un échantillon de données spécifique faisait partie de l'ensemble d'entraînement d'un modèle, souvent utilisée comme étape préliminaire à l'extraction.

📖

termini

Query-Based Attack

Stratégie d'attaque reposant exclusivement sur l'envoi de requêtes à l'API d'un modèle pour en déduire progressivement sa structure et ses paramètres internes.

📖

termini

Function Extraction Attack

Attaque spécialisée visant à reproduire la fonction de décision d'un modèle plutôt que ses paramètres exacts, en créant un modèle approximatif avec un comportement équivalent.

📖

termini

Parameter Extraction

Advanced technique for recovering the exact numerical values of a neural network's weights from observations of its outputs for different inputs.

📖

termini

API Abuse

Abusive exploitation of an AI service's access points to perform an excessive number of queries with the aim of extracting information about the underlying model.

📖

termini

Model Inversion

Reconstructive attack where the attacker uses a model's outputs to approximately reconstruct sensitive training data that was used for its learning.

📖

termini

Knowledge Distillation Attack

Malicious use of knowledge distillation techniques where the target model becomes the teacher and the attacker creates a student model that imitates its behavior.

📖

termini

Model Fingerprinting

Unique identification of a model by its distinctive behavioral characteristics, allowing to trace its origin and facilitate its targeted extraction.

📖

termini

White-box Extraction

Attack where the attacker has partial or complete access to the model's architecture, greatly facilitating the precise extraction of its parameters and functionalities.

📖

termini

Black-box Extraction

Model extraction performed without prior knowledge of the internal architecture, based solely on observed input-output relationships via the API.

📖

termini

Oracle Attack

Attack method treating the target model as an oracle providing answers to questions, using these answers to progressively reconstruct its internal logic.

📖

termini

Output Space Analysis

Analyse systématique de l'espace des sorties d'un modèle pour identifier des patterns et relations permettant de déduire sa structure interne et ses paramètres.

Glossario IA

Vol de Paramètres

Extraction de Fonctionnalité

Requêtes Adversariales

Inférence de Modèle

Shadow Modeling

Membership Inference

Query-Based Attack

Function Extraction Attack

Parameter Extraction

API Abuse

Model Inversion

Knowledge Distillation Attack

Model Fingerprinting

White-box Extraction

Black-box Extraction

Oracle Attack

Output Space Analysis

Nessun risultato trovato