Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
DBSCAN
Algorithme de clustering basé sur la densité qui regroupe des points suffisamment proches tout en marquant comme aberrants les points seuls dans des régions de faible densité.
Epsilon (ε)
Paramètre définissant le rayon de voisinage autour d'un point pour déterminer s'il appartient à un cluster, influençant directement la granularité du clustering.
MinPts
Paramètre seuil définissant le nombre minimum de points requis dans le voisinage ε pour qu'un point soit considéré comme un point core.
Point Core
Point central d'un cluster ayant au moins MinPts points dans son voisinage ε, servant de point d'ancrage pour former des clusters denses.
Point Border
Point situé à la périphérie d'un cluster, n'ayant pas assez de voisins pour être un point core mais étant atteignable depuis un point core.
Point Noise
Point n'appartenant à aucun cluster car il n'est ni un point core ni atteignable depuis un point core, souvent considéré comme une anomalie.
Voisinage ε
Ensemble des points situés à une distance inférieure ou égale à ε d'un point donné, formant la base du calcul de densité dans DBSCAN.
Densité-directement atteignable
Relation où un point q est directement accessible depuis un point core p si q se trouve dans le voisinage ε de p.
Densité-atteignable
Relation transitive où un point est atteignable depuis un point core à travers une chaîne de points densité-directement atteignables.
Densité-connectée
Relation symétrique où deux points sont connectés s'ils existent un point core commun duquel ils sont tous deux densité-atteignables.
OPTICS
Algorithme étendant DBSCAN qui produit un ordre de clustering basé sur la densité, permettant d'extraire des clusters de densités variables.
HDBSCAN
Variante hiérarchique de DBSCAN qui construit une hiérarchie de clusters de densités variables et sélectionne automatiquement les clusters stables.
Index R-tree
Structure de données d'indexation spatiale optimisant la recherche des voisins dans un rayon ε, accélérant significativement DBSCAN sur de grands datasets.
Curse of Dimensionality
Phénomène où la mesure de distance perd de sa signification dans les espaces de haute dimension, affectant les performances des algorithmes basés sur la densité.
Silhouette Score
Métrique d'évaluation mesurant la cohésion intra-cluster et la séparation inter-cluster, utilisée pour optimiser les paramètres ε et MinPts.
Clusters de forme arbitraire
Avantage majeur de DBSCAN permettant de détecter des clusters non convexes et de formes complexes, contrairement aux algorithmes comme K-means.
Détection d'anomalies
Application naturelle de DBSCAN où les points identifiés comme noise correspondent à des anomalies ou des outliers dans les données.
Partitionnement spatial
Processus de division de l'espace de données en régions basées sur la densité, fondement du fonctionnement de DBSCAN et algorithmes similaires.
Graphe de voisinage
Représentation graphique où les nœuds sont les points et les arêtes connectent les points dans le voisinage ε, utilisée pour visualiser la structure de densité.
Reachability Distance
Distance modifiée utilisée dans OPTICS et HDBSCAN qui tient compte de la densité locale pour ordonner les points selon leur accessibilité.
Core Distance
Distance minimale requise pour qu'un point devienne un point core, calculée comme la distance au MinPts-ième voisin le plus proche.