AI-woordenlijst
Het complete woordenboek van kunstmatige intelligentie
Prior Probability Shift
Changement dans la distribution de la variable cible (y) tandis que la distribution conditionnelle P(X|y) reste constante, affectant les prédictions du modèle.
Population Stability Index (PSI)
Métrique quantitative mesurant la différence de distribution entre deux ensembles de données (ex: entraînement vs production), utilisée pour détecter et quantifier le data drift.
Kolmogorov-Smirnov (KS) Test
Test statistique non paramétrique comparant les fonctions de distribution cumulatives de deux échantillons pour déterminer s'ils proviennent de la même distribution.
Hellinger Distance
Métrique de similarité entre deux distributions de probabilité, bornée entre 0 et 1, utilisée pour quantifier l'ampleur du data drift de manière interprétable.
Drift Detection Threshold
Valeur critique prédéfinie pour une métrique de drift (comme le PSI) au-delà de laquelle une alerte de dégradation des données est déclenchée pour une réévaluation du modèle.
Reference Window
Période temporelle ou ensemble de données utilisé comme base de référence stable pour comparer les distributions futures et identifier le data drift.
Detection Window
Intervalle temporel glissant sur les données en production sur lequel les statistiques sont calculées pour la comparaison avec la fenêtre de référence lors de la surveillance du drift.
Feature-wise Drift Detection
Analyse du drift au niveau de chaque variable individuelle (feature) pour identifier les caractéristiques spécifiques dont la distribution a changé, facilitant le diagnostic.
Multivariate Drift Detection
Approche analysant simultanément les changements dans la distribution jointe de plusieurs caractéristiques, capable de détecter des drifts non visibles au niveau univarié.
Incremental Drift Detection
Méthodes de détection qui mettent à jour les statistiques de référence au fur et à mesure que de nouvelles données arrivent, adaptant le modèle à des changements graduels.
Adaptive Windowing
Technique où la taille de la fenêtre de détection s'ajuste dynamiquement en fonction du taux de changement détecté, permettant une réactivité variable aux drifts.
Drift Root Cause Analysis
Processus d'investigation visant à identifier l'origine fondamentale du data drift (ex: changement de processus, erreur de collecte, évolution du comportement utilisateur).
Model Retraining Trigger
Condition automatisée, souvent basée sur le dépassement d'un seuil de drift, qui initie le processus de ré-entraînement ou de mise à jour d'un modèle de machine learning.
Statistical Process Control (SPC) for ML
Application des méthodes de contrôle qualité industriel, comme les cartes de contrôle, à la surveillance des métriques de modèles pour une détection robuste du drift.