AI 용어집
인공지능 완전 사전
Distance de Ward
Métrique spécifique évaluant l'augmentation de la variance intra-classe résultant de la fusion de deux clusters, utilisée dans la méthode de Ward pour optimiser la compacité globale des regroupements.
Classification Ascendante Hiérarchique (CAH)
Variante spécifique du clustering hiérarchique agglomératif largement utilisée en analyse de données françaises, construisant progressivement la hiérarchie par fusions successives basées sur des critères d'agrégation.
Classification Descendante Hiérarchique (CDH)
Approche divisive du clustering hiérarchique partant d'un cluster unique et le partitionnant récursivement, plus complexe computativalement que l'approche ascendante mais pouvant mieux révéler les structures naturelles des données.
Inertie Inter-classe
Variance entre les centroïdes des différents clusters, maximisée parallèlement à l'inertie intra-classe pour assurer une bonne séparation et distinction entre les groupes formés.
Coupe de Dendrogramme
Opération consistant à couper horizontalement le dendrogramme à une certaine hauteur pour déterminer le nombre optimal de clusters, basée sur des critères statistiques ou heuristiques comme le coude ou le gap statistic.
Chaînage (Chaining Effect)
Phénomène indésirable dans le clustering hiérarchique où des observations successivement proches forment de longues chaînes, résultant typiquement de l'utilisation du lien simple et créant des clusters peu interprétables.