KI-Glossar
Das vollständige Wörterbuch der Künstlichen Intelligenz
Adversarial Testing
Méthode d'évaluation consistant à soumettre un modèle à des exemples spécifiquement conçus pour induire des erreurs de prédiction, révélant ainsi ses vulnérabilités aux attaques ciblées.
Distribution Shift Detection
Processus d'identification des changements dans la distribution des données d'entrée par rapport aux données d'entraînement, crucial pour maintenir les performances du modèle en production.
Stress Testing
Évaluation intensive des limites d'un modèle en le soumettant à des conditions extrêmes ou inhabituelles pour identifier ses points de défaillance potentiels.
Perturbation Analysis
Étude systématique de l'impact de petites modifications dans les données d'entrée sur les prédictions du modèle, mesurant ainsi sa sensibilité aux variations.
Robustness Metrics
Indicateurs quantitatifs permettant de mesurer la résistance d'un modèle aux perturbations, comme le taux de précision sous bruit ou la variation des prédictions.
Input Validation
Processus de vérification des données d'entrée pour s'assurer qu'elles respectent les contraintes attendues, protégeant le modèle contre les entrées malveillantes ou invalides.
Boundary Testing
Évaluation du comportement du modèle aux frontières de son espace de décision, là où les prédictions sont les plus susceptibles de changer sous de légères perturbations.
Model Calibration
Ajustement des scores de confiance du modèle pour qu'ils reflètent précisément la probabilité réelle de correction des prédictions.
Feature Importance Stability
Évaluation de la cohérence de l'importance des caractéristiques sous différentes perturbations des données, mesurant la fiabilité de l'interprétabilité du modèle.
Domain Adaptation Robustness
Capacité d'un modèle à maintenir ses performances lorsqu'il est confronté à des données provenant de domaines légèrement différents de ceux de l'entraînement.
Outlier Resilience Testing
Évaluation de la capacité du modèle à gérer les valeurs aberrantes sans dégradation significative de ses performances prédictives.
Temporal Robustness
Mesure de la stabilité des prédictions du modèle face aux évolutions temporelles des patterns de données, particulièrement crucial pour les séries temporelles.
Gradient-Based Attack Testing
Simulation d'attaques utilisant les gradients du modèle pour créer des perturbations optimales maximisant les erreurs de prédiction.