Глоссарий ИИ
Полный словарь искусственного интеллекта
DBSCAN
Algorithme de clustering basé sur la densité qui regroupe des points suffisamment proches tout en marquant comme aberrants les points seuls dans des régions de faible densité.
Epsilon (ε)
Paramètre définissant le rayon de voisinage autour d'un point pour déterminer s'il appartient à un cluster, influençant directement la granularité du clustering.
MinPts
Paramètre seuil définissant le nombre minimum de points requis dans le voisinage ε pour qu'un point soit considéré comme un point core.
Point Core
Point central d'un cluster ayant au moins MinPts points dans son voisinage ε, servant de point d'ancrage pour former des clusters denses.
Point Border
Point situé à la périphérie d'un cluster, n'ayant pas assez de voisins pour être un point core mais étant atteignable depuis un point core.
Point Noise
Point n'appartenant à aucun cluster car il n'est ni un point core ni atteignable depuis un point core, souvent considéré comme une anomalie.
Voisinage ε
Ensemble des points situés à une distance inférieure ou égale à ε d'un point donné, formant la base du calcul de densité dans DBSCAN.
Densité-directement atteignable
Relation où un point q est directement accessible depuis un point core p si q se trouve dans le voisinage ε de p.
Достижимость по плотности
Транзитивное отношение, в котором точка достижима из основной (core) точки через цепочку точек, достижимых по плотности напрямую.
Связность по плотности
Симметричное отношение, в котором две точки связаны, если существует общая основная (core) точка, из которой обе точки достижимы по плотности.
OPTICS
Алгоритм, расширяющий DBSCAN, который создаёт упорядочивание кластеров на основе плотности, позволяя извлекать кластеры с переменной плотностью.
HDBSCAN
Иерархический вариант DBSCAN, который строит иерархию кластеров с переменной плотностью и автоматически выбирает стабильные кластеры.
R-tree индекс
Структура данных для пространственного индексирования, оптимизирующая поиск соседей в радиусе ε, значительно ускоряющая DBSCAN на больших наборах данных.
Проклятие размерности
Феномен, при котором мера расстояния теряет свою значимость в пространствах высокой размерности, что влияет на производительность алгоритмов, основанных на плотности.
Коэффициент силуэта
Метрика оценки, измеряющая когезию внутри кластера и разделение между кластерами, используемая для оптимизации параметров ε и MinPts.
Кластеры произвольной формы
Основное преимущество DBSCAN, позволяющее обнаруживать невыпуклые кластеры и кластеры сложной формы, в отличие от таких алгоритмов, как K-means.
Обнаружение аномалий
Естественное применение DBSCAN, где точки, идентифицированные как шум, соответствуют аномалиям или выбросам в данных.
Пространственное разбиение
Процесс деления пространства данных на области на основе плотности, основа работы DBSCAN и подобных алгоритмов.
Граф соседства
Графическое представление, где узлы - это точки, а ребра соединяют точки в ε-окрестности, используемое для визуализации структуры плотности.
Доступность расстояния
Модифицированное расстояние, используемое в OPTICS и HDBSCAN, которое учитывает локальную плотность для упорядочивания точек по их доступности.
Основное расстояние
Минимальное расстояние, необходимое для того, чтобы точка стала основной точкой, вычисляемое как расстояние до MinPts-го ближайшего соседа.