Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Distribution de fréquence
Représentation tabulaire ou graphique du nombre d'occurrences de chaque valeur ou classe d'une variable quantitative ou qualitative, permettant de visualiser la structure des données.
Histogramme
Graphique en barres contiguës représentant la distribution d'une variable quantitative continue, où la surface de chaque barre est proportionnelle à la fréquence des observations dans l'intervalle correspondant.
Boîte à moustaches
Diagramme statistique synthétisant la distribution d'une variable à travers cinq indicateurs : minimum, premier quartile, médiane, troisième quartile et maximum, révélant la symétrie et la présence de valeurs extrêmes.
Quartiles
Valeurs qui divisent un ensemble de données ordonnées en quatre parties égales, où Q1 représente le 25ème percentile, Q2 la médiane (50ème percentile) et Q3 le 75ème percentile.
Écart-type
Mesure de dispersion calculée comme la racine carrée de la variance, quantifiant la dispersion moyenne des observations autour de la moyenne de la distribution.
Variance
Moyenne des carrés des écarts par rapport à la moyenne, mesurant la dispersion des données et constituant la base du calcul de l'écart-type en analyse univariée.
Moyenne arithmétique
Indicateur de tendance centrale obtenu en divisant la somme de toutes les observations par leur nombre total, sensible aux valeurs extrêmes et approprié pour les données symétriques.
Médiane
Valeur centrale séparant la distribution ordonnée en deux parties égales, robuste aux valeurs extrêmes et particulièrement informative pour les distributions asymétriques.
Mode
Valeur ou catégorie apparaissant avec la plus grande fréquence dans une distribution, pouvant être unique, multiple ou inexistant selon la structure des données.
Étendue
Mesure de dispersion élémentaire calculée comme la différence entre la valeur maximale et minimale d'une variable, offrant une première appréciation de la variabilité des données.
Coefficient de variation
Ratio de l'écart-type sur la moyenne, exprimé en pourcentage, permettant de comparer la dispersion relative entre variables d'échelles différentes dans l'analyse univariée.
Skewness
Coefficient d'asymétrie mesurant le degré d'inclinaison d'une distribution par rapport à sa symétrie, distinguant les distributions gauches (négatives) des droites (positives).
Diagramme en barres
Représentation graphique de variables qualitatives ou quantitatives discrètes où la hauteur de chaque barre est proportionnelle à la fréquence ou à l'effectif de chaque catégorie.
Diagramme circulaire
Graphique partitionné en secteurs angulaires proportionnels aux fréquences relatives d'une variable qualitative, visualisant la composition d'un tout en pourcentages.
Diagramme de densité
Courbe lissée estimant la fonction de densité de probabilité d'une variable continue, offrant une visualisation alternative à l'histogramme pour identifier les modes et la forme de la distribution.
Écart interquartile
Mesure robuste de dispersion calculée comme la différence entre le troisième et premier quartile (Q3-Q1), représentant l'étendue contenant 50% des observations centrales.
Coefficient d'asymétrie de Pearson
Indice d'asymétrie basé sur la différence entre moyenne et médiane, normalisé par l'écart-type, offrant une mesure alternative du skewness particulièrement intuitive.
Valeurs aberrantes
Observations extrêmes s'écartant significativement du pattern général des données, identifiées par des méthodes comme l'écart interquartile (1.5×IQR) ou le score Z.