Глоссарий ИИ
Полный словарь искусственного интеллекта
Индекс Силуэта
Мера внутренней валидации, оценивающая связность и разделение кластеров путем сравнения среднего расстояния от точки до других точек ее кластера со средним расстоянием до точек ближайшего соседнего кластера.
Индекс Дэвиса-Булдина
Индекс внутренней валидации, который минимизирует отношение между внутрикластерным разбросом и межкластерным расстоянием, где более низкие значения указывают на лучшее качество кластеризации.
Индекс Калински-Харабаша
Критерий оценки, основанный на отношении межкластерной дисперсии к внутрикластерной дисперсии, где более высокие значения предполагают более четко определенные и разделенные кластеры.
Средний коэффициент силуэта
Среднее значение индивидуальных коэффициентов силуэта для всех точек набора данных, используемое как глобальная метрика для оценки общего качества кластеризации по шкале от -1 до 1.
Оптимальное разбиение
Конфигурация кластеров, которая максимизирует или минимизирует конкретный критерий валидации в зависимости от используемой метрики, представляющая теоретически наилучшую возможную сегментацию данных.
Внутренняя валидация
Подход к оценке, который использует только внутреннюю информацию данных для измерения качества кластеризации, не прибегая к внешним эталонным меткам.
Внешняя валидация
Метод оценки, сравнивающий результаты кластеризации с предопределенными метками или эталонной классификацией для измерения соответствия полученного разбиения.
Относительная валидация
Техника оценки, сравнивающая различные решения кластеризации между собой для идентификации лучшей конфигурации, особенно для определения оптимального числа кластеров.
Локтевой критерий
Эвристический визуальный метод для определения оптимального количества кластеров путем нахождения точки изгиба, где добавление дополнительных кластеров больше не приносит значительного улучшения.
Индекс Данна
Метрика внутренней валидации, вычисляющая отношение минимального межкластерного расстояния к максимальному внутрикластерному диаметру, где высокие значения указывают на лучшее разделение.
Скорректированный индекс Рэнда
Мера сходства между двумя разбиениями данных, скорректированная на случайность, оценивающая согласованность пар наблюдений, классифицированных вместе или отдельно в обеих сегментациях.
Индекс Жаккара
Коэффициент, измеряющий сходство между двумя множествами путем вычисления отношения их пересечения к объединению, адаптированный для сравнения результатов кластеризации.
Чистота кластера
Метрика внешней валидации, измеряющая степень, в которой каждый кластер содержит элементы одного доминирующего класса, со значениями, близкими к 1, указывающими на чистые кластеры.
Энтропия кластеризации
Мера, количественно оценивающая беспорядок или неопределенность в распределении классов внутри каждого кластера, где низкие значения указывают на лучшую однородность.
Показатель стабильности
Метрика, оценивающая надежность решения кластеризации путем измерения его согласованности при повторных выполнениях или при различных условиях выборки.
Внутрикластерная сплоченность
Мера компактности, оценивающая, насколько элементы одного кластера подобны или близки друг к другу, обычно вычисляемая как сумма внутрикластерных расстояний.
Межкластерное разделение
Критерий, измеряющий степень изоляции между различными кластерами, количественно определяемый минимальным, средним или центроидным расстоянием между различными группами.