Validation de clusters - Glossaire IA

📖

termes

Indice de Silhouette

Mesure de validation interne évaluant la cohésion et la séparation des clusters en comparant la distance moyenne d'un point aux autres points de son cluster par rapport à sa distance moyenne aux points du cluster voisin le plus proche.

📖

termes

Score de Davies-Bouldin

Indice de validation interne qui minimise le ratio entre la dispersion intra-cluster et la distance inter-cluster, où des valeurs plus faibles indiquent une meilleure qualité de partitionnement.

📖

termes

Indice de Calinski-Harabasz

Critère d'évaluation basé sur le rapport entre la dispersion inter-clusters et la dispersion intra-clusters, où des valeurs plus élevées suggèrent des clusters mieux définis et plus séparés.

📖

termes

Coefficient de silhouette moyen

Moyenne des coefficients de silhouette individuels pour tous les points du dataset, servant de métrique globale pour évaluer la qualité globale du clustering sur une échelle de -1 à 1.

📖

termes

Partition optimale

Configuration de clusters qui maximise ou minimise un critère de validation spécifique selon la métrique utilisée, représentant théoriquement la meilleure segmentation possible des données.

📖

termes

Validation interne

Approche d'évaluation qui utilise uniquement les informations intrinsèques aux données pour mesurer la qualité du clustering, sans recourir à des étiquettes de vérité terrain externes.

📖

termes

Validation externe

Méthode d'évaluation comparant les résultats du clustering à des étiquettes prédéfinies ou une classification de référence pour mesurer l'adéquation du partitionnement obtenu.

📖

termes

Validation relative

Technique d'évaluation comparant différentes solutions de clustering entre elles pour identifier la meilleure configuration, notamment pour déterminer le nombre optimal de clusters.

📖

termes

Critère d'Elbow

Méthode visuelle heuristique identifiant le nombre optimal de clusters en localisant le point d'inflexion où l'ajout de clusters supplémentaires n'apporte plus d'amélioration significative.

📖

termes

Indice de Dunn

Métrique de validation interne calculant le rapport entre la distance minimale inter-clusters et le diamètre maximal intra-cluster, où des valeurs élevées indiquent une meilleure séparation.

📖

termes

Indice de Rand ajusté

Mesure de similarité entre deux partitions de données, corrigée pour le hasard, évaluant la concordance des paires d'observations classées ensemble ou séparément dans les deux segmentations.

📖

termes

Indice de Jaccard

Coefficient mesurant la similarité entre deux ensembles en calculant le rapport entre leur intersection et leur union, adapté pour comparer des résultats de clustering.

📖

termes

Pureté du cluster

Métrique de validation externe mesurant le degré auquel chaque cluster contient des éléments d'une seule classe dominante, avec des valeurs proches de 1 indiquant des clusters purs.

📖

termes

Entropie de clustering

Mesure quantifiant le désordre ou l'incertitude dans la distribution des classes au sein de chaque cluster, où des valeurs faibles indiquent une meilleure homogénéité.

📖

termes

Score de stabilité

Métrique évaluant la robustesse d'une solution de clustering en mesurant sa cohérence lors d'exécutions répétées ou sous différentes conditions d'échantillonnage.

📖

termes

Cohésion intra-cluster

Mesure de compacité évaluant à quel point les éléments d'un même cluster sont similaires ou proches les uns des autres, généralement calculée comme la somme des distances intra-cluster.

📖

termes

Séparation inter-cluster

Critère mesurant le degré d'isolation entre différents clusters, quantifié par la distance minimale, moyenne ou centroïde entre les groupes distincts.

Glossaire IA

Indice de Silhouette

Score de Davies-Bouldin

Indice de Calinski-Harabasz

Coefficient de silhouette moyen

Partition optimale

Validation interne

Validation externe

Validation relative

Critère d'Elbow

Indice de Dunn

Indice de Rand ajusté

Indice de Jaccard

Pureté du cluster

Entropie de clustering

Score de stabilité

Cohésion intra-cluster

Séparation inter-cluster

Aucun résultat trouvé