Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Coefficient de silhouette
Métrique d'évaluation de clustering mesurant la cohésion intra-cluster par rapport à la séparation inter-cluster, variant de -1 à 1.
Clustering DBSCAN
Algorithme de clustering basé sur la densité qui regroupe les points proches en marquant comme outliers les points situés dans des régions de faible densité.
Matrice de similarité
Structure carrée contenant les coefficients de similarité entre toutes les paires d'observations, essentielle pour de nombreux algorithmes de clustering.
Clustering divisif
Approche top-down du clustering hiérarchique commençant avec toutes les observations dans un seul cluster, le divisant récursivement en sous-clusters.
Algorithme des K-modes
Extension de K-means pour les données catégorielles utilisant la dissimilarité simple et le mode comme mesure de centralité au lieu de la moyenne.
Clustering flou
Méthode où chaque point peut appartenir à plusieurs clusters avec différents degrés d'appartenance, contrairement au clustering dur où l'appartenance est binaire.
Algorithme OPTICS
Extension de DBSCAN produisant un ordrement des points qui révèle la structure de densité des données, permettant l'extraction de clusters à différentes densités.
Coefficient de Dunn
Indice de validation de clustering mesurant le ratio entre la plus petite distance inter-cluster et le plus grand diamètre intra-cluster.
Validation de clustering
Processus d'évaluation quantitative et qualitative des résultats de clustering utilisant des indices internes, externes ou relatifs pour mesurer la qualité.
Clustering basé sur la densité
Catégorie d'algorithmes qui identifient les clusters comme des régions denses séparées par des régions de faible densité dans l'espace des données.
Clustering par partitionnement
Famille d'algorithmes divisant directement les données en K clusters non hiérarchiques, optimisant généralement un critère de distance ou de similarité.