Глоссарий ИИ
Полный словарь искусственного интеллекта
DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
Алгоритм неконтролируемой кластеризации, который группирует плотно заселенные точки, отмечая изолированные точки в регионах низкой плотности как аномалии или шум.
LOF (Local Outlier Factor)
Метод обнаружения аномалий, который измеряет отклонение локальной плотности точки по сравнению с ее соседями, идентифицируя выбросы как точки со значительно более низкой плотностью.
Epsilon (ε) dans DBSCAN
Параметр расстояния, определяющий радиус окрестности вокруг точки для определения, принадлежит ли она к плотной области, критически важный для чувствительности алгоритма.
MinPts dans DBSCAN
Параметр порога, указывающий минимальное количество точек, необходимых в окрестности эпсилон, чтобы точка считалась центральной точкой (core point).
Point Central (Core Point)
Точка, которая имеет как минимум MinPts соседей в своем радиусе эпсилон, служащая семенем для формирования плотного кластера в DBSCAN.
K-distance
Расстояние между точкой и ее k-м ближайшим соседом, используемое как основа для вычисления локальной плотности в алгоритме LOF.
Portée de K-distance (Reachability Distance)
Расстояние достижимости, используемое в LOF, определяемое как максимум из k-расстояния соседа и фактического расстояния между двумя точками для стабилизации измерений плотности.
Densité Locale Atteignable (Local Reachability Density - LRD)
Обратное среднее значение достижимого k-расстояния точки относительно ее соседей, количественно оценивающее локальную плотность вокруг этой точки в алгоритме LOF.
Локальный фактор выбросов (Local Outlier Factor - LOF)
Соотношение достижимой локальной плотности точки к средней плотности ее соседей, где значение больше 1 указывает на вероятность быть выбросом.
OPTICS (Ordering Points To Identify the Clustering Structure)
Плотностной алгоритм, расширяющий DBSCAN, который создает порядок точек, представляющий структуру плотности, позволяющий извлекать кластеры при различных разрешениях без фиксированного параметра эпсилон.
Граф достижимости (Reachability Graph)
Визуальное представление достижимости k-расстояния для каждой точки, генерируемое OPTICS для идентификации долин плотности, соответствующих кластерам.
Дерево конденсации кластеров (Cluster Tree Condensation)
Процесс в HDBSCAN, который упрощает иерархическое дерево кластеров путем слияния кластеров, которые не являются устойчивыми на различных масштабах плотности.
Оценка аномалии на основе плотности
Количественная метрика, оценивающая степень изоляции точки в зависимости от плотности ее окрестности, используемая для классификации серьезности обнаруженных аномалий.
Метод ближайшего соседа на основе плотности (Density-Based Nearest Neighbor)
Подход к обнаружению аномалий, где точка считается выбросом, если расстояние до ее ближайшего соседа значительно превышает среднее расстояние других точек.
Субдискретизация на основе плотности (Density-Based Subsampling)
Техника предварительной обработки, которая уменьшает размер набора данных, предпочтительно сохраняя точки из областей низкой плотности, улучшая эффективность обнаружения аномалий.
Изоляционный лес vs. Плотность
Концептуальное различие, где Изоляционный лес идентифицирует аномалии по их легкости изоляции в пространстве признаков, в то время как методы на основе плотности идентифицируют их по низкой пространственной концентрации.