Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Indice de Silhouette
Mesure de validation interne évaluant la cohésion et la séparation des clusters en comparant la distance moyenne d'un point aux autres points de son cluster par rapport à sa distance moyenne aux points du cluster voisin le plus proche.
Score de Davies-Bouldin
Indice de validation interne qui minimise le ratio entre la dispersion intra-cluster et la distance inter-cluster, où des valeurs plus faibles indiquent une meilleure qualité de partitionnement.
Indice de Calinski-Harabasz
Critère d'évaluation basé sur le rapport entre la dispersion inter-clusters et la dispersion intra-clusters, où des valeurs plus élevées suggèrent des clusters mieux définis et plus séparés.
Coefficient de silhouette moyen
Moyenne des coefficients de silhouette individuels pour tous les points du dataset, servant de métrique globale pour évaluer la qualité globale du clustering sur une échelle de -1 à 1.
Partition optimale
Configuration de clusters qui maximise ou minimise un critère de validation spécifique selon la métrique utilisée, représentant théoriquement la meilleure segmentation possible des données.
Validation interne
Approche d'évaluation qui utilise uniquement les informations intrinsèques aux données pour mesurer la qualité du clustering, sans recourir à des étiquettes de vérité terrain externes.
Validation externe
Méthode d'évaluation comparant les résultats du clustering à des étiquettes prédéfinies ou une classification de référence pour mesurer l'adéquation du partitionnement obtenu.
Validation relative
Technique d'évaluation comparant différentes solutions de clustering entre elles pour identifier la meilleure configuration, notamment pour déterminer le nombre optimal de clusters.
Critère d'Elbow
Méthode visuelle heuristique identifiant le nombre optimal de clusters en localisant le point d'inflexion où l'ajout de clusters supplémentaires n'apporte plus d'amélioration significative.
Indice de Dunn
Métrique de validation interne calculant le rapport entre la distance minimale inter-clusters et le diamètre maximal intra-cluster, où des valeurs élevées indiquent une meilleure séparation.
Indice de Rand ajusté
Mesure de similarité entre deux partitions de données, corrigée pour le hasard, évaluant la concordance des paires d'observations classées ensemble ou séparément dans les deux segmentations.
Indice de Jaccard
Coefficient mesurant la similarité entre deux ensembles en calculant le rapport entre leur intersection et leur union, adapté pour comparer des résultats de clustering.
Pureté du cluster
Métrique de validation externe mesurant le degré auquel chaque cluster contient des éléments d'une seule classe dominante, avec des valeurs proches de 1 indiquant des clusters purs.
Entropie de clustering
Mesure quantifiant le désordre ou l'incertitude dans la distribution des classes au sein de chaque cluster, où des valeurs faibles indiquent une meilleure homogénéité.
Score de stabilité
Métrique évaluant la robustesse d'une solution de clustering en mesurant sa cohérence lors d'exécutions répétées ou sous différentes conditions d'échantillonnage.
Cohésion intra-cluster
Mesure de compacité évaluant à quel point les éléments d'un même cluster sont similaires ou proches les uns des autres, généralement calculée comme la somme des distances intra-cluster.
Séparation inter-cluster
Critère mesurant le degré d'isolation entre différents clusters, quantifié par la distance minimale, moyenne ou centroïde entre les groupes distincts.