Глоссарий ИИ
Полный словарь искусственного интеллекта
Нечёткое симплициальное множество
Математическая структура, используемая UMAP для представления отношений соседства между точками данных, позволяющая гибкое моделирование локальных связей в пространстве высокой размерности.
Обучение многообразий
Парадигма неконтролируемого обучения, предполагающая, что данные высокой размерности лежат на многообразии меньшей размерности, и стремящаяся обнаружить эту базовую структуру.
Локальная связность
Способность метода снижения размерности сохранять отношения непосредственного соседства между близкими точками в исходном пространстве после проекции в пространство низкой размерности.
Оптимизация по перекрёстной энтропии
Процесс оптимизации, используемый UMAP для минимизации расхождения между вероятностями соседства в пространствах высокой и низкой размерностей, сохраняя таким образом топологическую структуру.
Количество соседей (n_neighbors)
Ключевой параметр UMAP, контролирующий баланс между сохранением локальной и глобальной структуры, определяющий размер локального соседства, рассматриваемого для каждой точки данных.
Минимальное расстояние (min_dist)
Параметр UMAP, регулирующий степень компактности точек в пространстве проекции, контролирующий эффективное минимальное расстояние между соседними точками в финальном вложении.
Метрика расстояния
Математическая функция, используемая UMAP для измерения сходств между точками в пространстве высокой размерности, непосредственно влияющая на обнаруженную топологическую структуру.
Сохранение глобальной структуры
Способность UMAP сохранять отношения крупного масштаба между удалёнными кластерами данных, избегая эффекта 'проблемы скученности', типичного для техник t-SNE.
Стохастический градиентный спуск
Алгоритм оптимизации, используемый UMAP для итеративной корректировки позиций точек в пространстве низкой размерности путем минимизации функции потерь.
Топологический анализ данных
Раздел прикладной математики, на который опирается UMAP, изучающий инвариантные свойства при непрерывной деформации для понимания структуры данных.
Функция потерь UMAP
Целевая функция, специфичная для UMAP, комбинирующая притягивающие силы для соседей и отталкивающие силы для несоседних точек, оптимизируемая через нечеткую кросс-энтропию.
Внутренняя размерность
Минимальное количество размерностей, необходимое для точного представления существенной структуры данных, ключевая концепция, которую UMAP стремится оценить и сохранить.
Спектр собственных значений
Набор собственных значений лапласовской матрицы графа соседства, используемый UMAP для определения оптимальной геометрической структуры проекции.
Притягивающе-отталкивающая сила
Физический механизм, моделируемый UMAP, где соседние точки притягиваются, а несоседние точки отталкиваются, создавая сбалансированное пространственное расположение.
Преобразование UMAP
Функция отображения, изучаемая UMAP, позволяющая проецировать новые точки в уже вычисленное пространство без необходимости полного пересчета вложения.