Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Extreme Value Theory
Branche des statistiques étudiant les comportements asymptotiques des extrêmes d'une distribution, permettant de modéliser et prédire des événements rares de grande magnitude.
Robust Statistics
Ensemble de méthodes statistiques résistantes aux violations d'hypothèses et aux valeurs extrêmes, fournissant des estimations fiables même en présence de données contaminées.
Winsorization
Technique de transformation statistique remplaçant les valeurs extrêmes par des quantiles spécifiés, limitant ainsi l'influence des observations aberrantes sur l'analyse.
Cook's Distance
Mesure d'influence en régression identifiant les observations ayant un impact disproportionné sur les paramètres estimés du modèle, combinant effet de levier et résidus.
Leverage Points
Observations avec des valeurs prédictrices extrêmes pouvant exercer une influence excessive sur les coefficients de régression, même si elles suivent le modèle attendu.
Breakdown Point
Proportion minimale de contamination qu'un estimateur statistique peut tolérer avant de produire des résultats arbitrairement incorrects, mesurant la robustesse d'une méthode.
DBSCAN Clustering
Algorithme de clustering basé sur la densité capable d'identifier automatiquement les clusters de formes arbitraires et les points de bruit comme valeurs extrêmes.
Grubbs' Test
Test statistique paramétrique pour détecter une seule valeur aberrante dans des données normalement distribuées, basé sur les écarts-types standardisés.
Extreme Percentile Method
Approche identifiant les valeurs extrêmes en se basant sur les centiles supérieurs ou inférieurs de la distribution, commonly utilisant les 1% ou 5% extrêmes comme seuil.
Median Absolute Deviation
Mesure robuste de dispersion calculée à partir des écarts médians absolus, résistante aux valeurs extrêmes et alternative à l'écart-type standard.
Influential Observations
Points de données dont la présence ou l'absence modifie significativement les résultats d'une analyse statistique, détectés par des mesures comme la distance de Cook.
Tukey's Fences
Méthode de détection de valeurs extrêmes utilisant des bornes basées sur l'écart interquartile, typiquement 1.5*IQR pour les valeurs modérées et 3*IQR pour les extrêmes.
Chauvenet's Criterion
Test statistique classique identifiant les valeurs aberrantes basé sur la probabilité d'occurrence d'une observation dans une distribution normale supposée.