Słownik AI
Kompletny słownik sztucznej inteligencji
Stabilité des explications
Propriété mesurant la cohérence des explications générées par un modèle lorsque les entrées subissent de légères variations, garantissant la fiabilité des interprétations face au bruit.
Sensibilité aux perturbations
Capacité d'une méthode explicative à maintenir des résultats cohérents lorsque les données d'entrée sont modifiées par des perturbations aléatoires ou structurées.
Attaques adversariales sur les explications
Techniques malveillantes conçues pour manipuler ou dégrader la qualité des explications sans nécessairement affecter la performance prédictive du modèle sous-jacent.
Cohérence des explications
Mesure qualitative évaluant si les explications générées sont logiquement compatibles entre elles et avec les connaissances du domaine, assurant une interprétation cohérente.
Fidélité des explications
Degré de précision avec lequel une explication approxime le comportement réel du modèle localement ou globalement, quantifiant la confiance dans l'interprétation fournie.
Robustesse des modèles explicatifs
Capacité intrinsèque des systèmes explicatifs à résister aux variations des données d'entrée et aux tentatives de manipulation tout en maintenant des interprétations valides et fiables.
Variance des explications
Mesure statistique quantifiant la dispersion des explications générées pour des entrées similaires, indiquant la stabilité et la prévisibilité du système explicatif.
Continuité des explications
Propriété garantissant que de petites modifications dans l'espace d'entrée entraînent des changements proportionnels et progressifs dans les explications produites.
Invariance des explications
Caractéristique d'une méthode explicative à produire des résultats constants face à des transformations préservant la sémantique, comme les rotations ou les changements d'échelle.
Validation croisée des explications
Méthodologie systématique pour évaluer la cohérence et la robustesse des explications à travers différents sous-ensembles de données et configurations de modèle.
Évaluation de la robustesse explicative
Ensemble de métriques et protocoles standardisés pour quantifier systématiquement la résistance des explications aux perturbations et aux attaques adversariales.
Perturbations sémantiques
Modifications intentionnelles des données d'entrée qui préservent le sens global mais altèrent les caractéristiques superficielles, utilisées pour tester la robustesse des explications.
Attaques par transfert explicatif
Stratégies adversariales exploitant la similarité entre différents modèles ou architectures pour compromettre simultanément leurs systèmes explicatifs respectifs.
Calibration des explications
Processus d'ajustement systématique des scores ou poids explicatifs pour garantir une correspondance fiable entre l'importance perçue et l'impact réel sur les prédictions.
Consistance temporelle des explications
Propriété mesurant la stabilité des explications sur des données temporelles ou séquentielles, assurant une interprétation cohérente à travers différentes fenêtres temporelles.
Agrégation d'explications multiples
Technique combinant plusieurs explications individuelles pour produire une interprétation plus robuste et stable, réduisant l'impact des variations aléatoires ou biaisées.
Sensibilité aux hyperparamètres
Mesure de la dépendance des explications générées vis-à-vis des choix d'hyperparamètres, évaluant la robustesse du système explicatif face à sa propre configuration.
Isotropie des explications
Propriété garantissant que les explications présentent une distribution uniforme et non biaisée dans l'espace des caractéristiques, évitant les distorsions directionnelles systématiques.
Décomposition de l'incertitude explicative
Méthode analytique séparant les sources d'incertitude dans les explications (épistémique, aléatoire, modèle) pour quantifier et améliorer la fiabilité interprétative.