Глоссарий ИИ
Полный словарь искусственного интеллекта
Коэффициент силуэта
Метрика оценки кластеризации, измеряющая внутрикластерную сплоченность относительно межкластерного разделения, варьирующаяся от -1 до 1.
Кластеризация DBSCAN
Алгоритм кластеризации на основе плотности, который группирует близкие точки, помечая как выбросы точки, находящиеся в областях с низкой плотностью.
Матрица схожести
Квадратная структура, содержащая коэффициенты схожести между всеми парами наблюдений, необходимая для многих алгоритмов кластеризации.
Дивизивная кластеризация
Подход сверху-вниз в иерархической кластеризации, начинающийся со всех наблюдений в одном кластере и рекурсивно разделяющий его на подкластеры.
Алгоритм K-мод
Расширение K-средних для категориальных данных, использующее простую несхожесть и моду как меру центральности вместо среднего значения.
Нечеткая кластеризация
Метод, в котором каждая точка может принадлежать нескольким кластерам с различными степенями принадлежности, в отличие от жесткой кластеризации, где принадлежность бинарна.
Алгоритм OPTICS
Расширение DBSCAN, производящее упорядочивание точек, которое раскрывает структуру плотности данных, позволяя извлекать кластеры при различных плотностях.
Коэффициент Данна
Индекс валидации кластеризации, измеряющий отношение между наименьшим межкластерным расстоянием и наибольшим внутрикластерным диаметром.
Валидация кластеризации
Процесс количественной и качественной оценки результатов кластеризации с использованием внутренних, внешних или относительных индексов для измерения качества.
Кластеризация на основе плотности
Категория алгоритмов, которые идентифицируют кластеры как плотные области, разделенные областями с низкой плотностью в пространстве данных.
Кластеризация методом разбиения
Семейство алгоритмов, непосредственно разделяющих данные на K неиерархических кластеров, обычно оптимизирующих критерий расстояния или схожести.