Глоссарий ИИ
Полный словарь искусственного интеллекта
Кластеризация потоков (Stream Clustering)
Набор методов, направленных на разделение данных, поступающих непрерывно и потенциально бесконечно, в реальном времени и с ограниченными ресурсами.
Макро-кластер
Стабильное и долгосрочное представление кластера, часто получаемое в результате слияния или эволюции микро-кластеров для фиксации устойчивых тенденций потока.
Окно с опорной точкой (Landmark Window)
Модель памяти, которая обрабатывает все данные, начиная с фиксированной точки отсчета во времени, полезная для анализа изменений после знаменательного события.
Потоковая кластеризация на основе плотности (Density-Based Stream Clustering)
Подход кластеризации, который выявляет плотные области точек данных в потоке, способный обрабатывать кластеры произвольной формы и обнаруживать шум.
Алгоритм DBSTREAM
Алгоритм потоковой кластеризации на основе плотности, использующий плотные сетки и микро-кластеры для эффективного управления памятью и быстрого обнаружения дрейфов.
Фактор плотности (Density Factor)
Метрика, используемая в некоторых алгоритмах потоковой кластеризации для оценки плотности микро-кластера, влияющая на его создание, слияние или удаление.
Убывающий вес (Decaying Weight)
Механизм, придающий меньшую важность более старым точкам данных, позволяющий модели сосредоточиться на недавних тенденциях потока.
Онлайн-кластеризация (Online Clustering)
Этап процесса, на котором каждая новая точка данных обрабатывается и назначается микро-кластеру инкрементным образом, без необходимости наличия всего набора данных.
Офлайн-кластеризация (Offline Clustering)
Необязательный этап, который генерирует финальные макро-кластеры на основе существующих микро-кластеров, часто по запросу пользователя для анализа в определенный момент времени.
Динамическая сетка (Dynamic Grid)
Пространственная структура данных, которая адаптируется путем разделения или объединения ячеек для отслеживания изменений распределения данных в потоке, оптимизируя использование памяти.
Обнаружение аномалий в потоке (Stream Anomaly Detection)
Процесс, интегрированный в кластеризацию потоков, который идентифицирует точки данных, не принадлежащие ни одному плотному кластеру, помечая их как аномалии или шум.
Синопсис кластера (Cluster Synopsis)
Компактное представление кластера (или микро-кластера), содержащее важную статистику, такую как центр, радиус и вес, позволяющее выполнять эффективные вычисления.
Алгоритм DenStream
Алгоритм потоковой кластеризации на основе плотности, который различает потенциальные микро-кластеры и основные микро-кластеры для моделирования возникающих и стабильных кластеров.
Временной горизонт (Time Horizon)
Параметр, определяющий период актуальности данных в модели кластеризации потоков, влияющий на скорость, с которой модель забывает старую информацию.