Глоссарий ИИ
Полный словарь искусственного интеллекта
Кластеризация методом K-средних
Итерационный алгоритм разбиения, который группирует данные в K кластеров, минимизируя внутрикластерную дисперсию.
Иерархическая кластеризация
Метод, который строит иерархию кластеров с использованием восходящего (агломеративного) или нисходящего (дивизивного) подхода.
DBSCAN
Алгоритм кластеризации на основе плотности, который выявляет кластеры произвольной формы и обнаруживает выбросы.
Метод главных компонент (МГК/PCA)
Метод линейного снижения размерности, проецирующий данные на оси с максимальной дисперсией.
t-SNE
Алгоритм нелинейного снижения размерности, специализированный на визуализации данных высокой размерности.
UMAP
Современная техника понижения размерности, сохраняющая глобальную структуру лучше, чем t-SNE, с более быстрыми вычислениями.
Спектральная кластеризация
Метод, использующий собственные значения матрицы сходства для кластеризации невыпуклых данных.
Автоэнкодеры
Нейронные сети без учителя, которые обучаются сжатому представлению данных с помощью кодирования-декодирования.
Кластеризация с помощью смесевых моделей
Вероятностный подход, моделирующий данные как смесь гауссовских распределений для мягкой кластеризации.
Матричная факторизация
Техника снижения размерности, разлагающая матрицу на произведение матриц меньшего ранга.
Нечеткая кластеризация (Fuzzy C-means)
Вариант кластеризации, в котором каждая точка может принадлежать нескольким кластерам с различными степенями принадлежности.
Isomap
Алгоритм обучения многообразиям, сохраняющий геодезические расстояния для снижения размерности.
LDA (латентное размещение Дирихле)
Вероятностная модель для снижения размерности и кластеризации в анализе текстов и тематическом моделировании.
OPTICS
Расширение алгоритма DBSCAN, создающее порядок кластеризации, позволяющий выявлять структуры с переменной плотностью.
Отбор признаков (Feature Selection)
Снижение размерности путем отбора наиболее релевантных переменных, а не создания новых комбинаций.