Глоссарий ИИ
Полный словарь искусственного интеллекта
Кластеризация на основе сеток
Метод разделения, который делит пространство данных на конечное число прямоугольных ячеек для формирования сеток, а затем выполняет кластеризацию на этих ячейках, а не на отдельных точках данных.
Ячейка сетки
Элементарная пространственная единица сетки, представляющая гиперпрямоугольную область пространства данных, содержащую набор точек и характеризующуюся статистикой, такой как плотность или центр масс.
Плотность ячейки
Мера количества точек данных на единицу объема в ячейке сетки, используемая в качестве основного критерия для определения того, достаточно ли ячейка плотна, чтобы принадлежать кластеру.
STING (Statistical Information Grid)
Многоуровневый иерархический алгоритм кластеризации, который хранит статистическую информацию в каждой ячейке сетки и позволяет эффективно запрашивать кластеры на различных уровнях гранулярности.
WaveCluster
Техника кластеризации на основе сеток, основанная на вейвлет-анализе, которая применяет преобразование для выявления областей высокой плотности в дискретизированном пространстве данных.
CLIQUE (Clustering In QUEst)
Алгоритм кластеризации на основе сеток для данных высокой размерности, который выявляет плотные подпространства и объединяет связанные ячейки сетки для формирования кластеров.
Равномерная сетка
Тип дискретизации, при котором пространство данных делится на ячейки равного размера по каждому измерению, что обеспечивает простоту реализации, но может приводить к появлению пустых ячеек или ячеек с переменной плотностью.
Адаптивная сетка
Подход к дискретизации, при котором размер ячеек сетки динамически настраивается в соответствии с локальным распределением данных, что позволяет лучше представлять области высокой и низкой плотности.
Вектор признаков ячейки
Набор статистических атрибутов (среднее значение, дисперсия, минимум, максимум, плотность), связанных с каждой ячейкой сетки для эффективного суммирования содержащихся в ней точек данных.
Связность ячеек
Топологическое отношение, определяющее, являются ли две ячейки сетки смежными (имеют общую грань, ребро или вершину) и могут ли они быть объединены для формирования единого кластера.
Объединение плотных ячеек
Итеративный процесс агрегирования смежных ячеек сетки, превышающих порог плотности, для построения кластеров произвольной формы в пространстве данных.
Многоразрешающая сетка
Возможность анализа данных на нескольких уровнях детализации с использованием иерархии вложенных сеток, что позволяет обнаруживать кластеры на различных пространственных масштабах.
Порог плотности
Критический параметр в алгоритмах кластеризации на основе сеток, определяющий минимальную плотность, необходимую для того, чтобы ячейка считалась значимой и была включена в кластер.
Матрица сетки
Двумерная или многомерная структура данных, представляющая дискретизацию пространства, где каждый элемент соответствует ячейке сетки и хранит ее статистическую информацию.
OptiGrid
Алгоритм кластеризации на основе сеток, который строит оптимальные гиперплоскости для разделения пространства на ячейки, максимизируя разделение между потенциальными кластерами в каждом подпространстве.
Пространственная индексация на основе сеток
Использование структуры сетки в качестве пространственного индекса для ускорения запросов соседства и операций кластеризации в базах данных большого объема.
Пограничная ячейка
Ячейка сетки, расположенная на периферии потенциального кластера, принадлежность которой кластеру требует более глубокого анализа из-за ее промежуточной плотности.
Снижение размерности на основе сеток
Техника, при которой дискретизация по сетке позволяет снизить вычислительную сложность путем проецирования данных в пространство ячеек размерности меньшей, чем у исходных данных.
Шум в кластеризации на основе сеток
Изолированные точки данных в ячейках низкой плотности, которые автоматически отфильтровываются алгоритмом кластеризации на основе сеток, так как они не соответствуют минимальному порогу плотности.