YZ Sözlüğü
Yapay Zekanın tam sözlüğü
DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
Unsupervised clustering algorithm that groups densely populated points together while marking isolated points in low-density regions as anomalies or noise.
LOF (Local Outlier Factor)
Anomaly detection method that measures the local density deviation of a point compared to its neighbors, identifying outliers as points with significantly lower density.
Epsilon (ε) in DBSCAN
Distance parameter defining the radius of the neighborhood around a point to determine whether it belongs to a dense region, crucial for the algorithm's sensitivity.
MinPts in DBSCAN
Threshold parameter indicating the minimum number of points required in the epsilon neighborhood for a point to be considered a core point.
Core Point
Point that has at least MinPts neighbors within its epsilon radius, serving as a seed for forming a dense cluster in DBSCAN.
K-distance
Distance between a point and its k-th nearest neighbor, used as the basis for calculating local density in the LOF algorithm.
Reachability Distance
Reachability distance used in LOF, defined as the maximum of the neighbor's k-distance and the actual distance between two points, to stabilize density measurements.
Local Reachability Density (LRD)
Inverse of the average k-distance reachability of a point relative to its neighbors, quantifying the local density around that point in the LOF algorithm.
Facteur Anormal Local (Local Outlier Factor - LOF)
Ratio de la densité locale atteignable d'un point à la densité moyenne de ses voisins, où un score supérieur à 1 indique une probabilité d'être un outlier.
OPTICS (Ordering Points To Identify the Clustering Structure)
Algorithme de densité étendant DBSCAN qui crée un ordre des points représentant la structure de densité, permettant l'extraction de clusters à différentes résolutions sans paramètre epsilon fixe.
Graphe de Portée (Reachability Graph)
Représentation visuelle de la portée de k-distance pour chaque point, générée par OPTICS pour identifier les vallées de densité correspondant aux clusters.
Arbre de Condensation (Cluster Tree Condensation)
Processus dans HDBSCAN qui simplifie l'arbre de clusters hiérarchique en fusionnant les clusters qui ne sont pas persistants à travers différentes échelles de densité.
Score d'Anomalie Basé sur la Densité
Métrique quantitative qui évalue le degré d'isolation d'un point en fonction de la densité de son voisinage, utilisée pour classer la sévérité des anomalies détectées.
Méthode du Plus Proche Voisin en Densité (Density-Based Nearest Neighbor)
Approche de détection d'anomalies où un point est considéré comme outlier si la distance à son plus proche voisin est significativement supérieure à la distance moyenne des autres points.
Sous-échantillonnage Basé sur la Densité (Density-Based Subsampling)
Technique de prétraitement qui réduit la taille du jeu de données en conservant préférentiellement les points des régions de faible densité, améliorant l'efficacité de la détection d'anomalies.
Isolation Forest vs. Densité
Distinction conceptuelle où Isolation Forest identifie les anomalies par leur facilité d'isolation dans l'espace des features, tandis que les méthodes basées sur la densité les identifient par leur faible concentration spatiale.