Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
Vol de Paramètres
Processus par lequel un attaquant récupère les poids et biais d'un réseau neuronal entraîné pour recréer une copie fonctionnelle du modèle original sans accès direct aux fichiers.
Extraction de Fonctionnalité
Méthode consistant à déduire les caractéristiques d'apprentissage et les représentations internes d'un modèle en observant ses comportements face à diverses entrées.
Requêtes Adversariales
Ensemble d'entrées spécifiquement conçues pour sonder les limites et comportements d'un modèle dans le but d'en extraire des informations sensibles sur son architecture ou ses paramètres.
Inférence de Modèle
Processus de déduction des propriétés d'un modèle cible (architecture, hyperparamètres, données d'entraînement) à partir de ses prédictions et réponses aux requêtes.
Shadow Modeling
Technique où l'attaquant entraîne plusieurs modèles substituts pour approximer le comportement du modèle cible, facilitant ensuite l'extraction de ses caractéristiques internes.
Membership Inference
Attaque visant à déterminer si un échantillon de données spécifique faisait partie de l'ensemble d'entraînement d'un modèle, souvent utilisée comme étape préliminaire à l'extraction.
Query-Based Attack
Stratégie d'attaque reposant exclusivement sur l'envoi de requêtes à l'API d'un modèle pour en déduire progressivement sa structure et ses paramètres internes.
Function Extraction Attack
Attaque spécialisée visant à reproduire la fonction de décision d'un modèle plutôt que ses paramètres exacts, en créant un modèle approximatif avec un comportement équivalent.
Parameter Extraction
Advanced technique for recovering the exact numerical values of a neural network's weights from observations of its outputs for different inputs.
API Abuse
Abusive exploitation of an AI service's access points to perform an excessive number of queries with the aim of extracting information about the underlying model.
Model Inversion
Reconstructive attack where the attacker uses a model's outputs to approximately reconstruct sensitive training data that was used for its learning.
Knowledge Distillation Attack
Malicious use of knowledge distillation techniques where the target model becomes the teacher and the attacker creates a student model that imitates its behavior.
Model Fingerprinting
Unique identification of a model by its distinctive behavioral characteristics, allowing to trace its origin and facilitate its targeted extraction.
White-box Extraction
Attack where the attacker has partial or complete access to the model's architecture, greatly facilitating the precise extraction of its parameters and functionalities.
Black-box Extraction
Model extraction performed without prior knowledge of the internal architecture, based solely on observed input-output relationships via the API.
Oracle Attack
Attack method treating the target model as an oracle providing answers to questions, using these answers to progressively reconstruct its internal logic.
Output Space Analysis
Analyse systématique de l'espace des sorties d'un modèle pour identifier des patterns et relations permettant de déduire sa structure interne et ses paramètres.