AI 詞彙表
人工智能完整詞典
UMAP
Uniform Manifold Approximation and Projection,一种非线性降维算法,能够在低维空间中同时保留数据的局部和全局结构。
微分流形
一种在局部上类似于欧几里得空间的拓扑空间,基于流形理论来建模高维数据的内在结构。
模糊单纯集
一种数学结构,通过为点之间的关系赋予权重来推广单纯集,允许在UMAP中对邻域关系进行模糊表示。
谱嵌入
一种基于相似性矩阵特征分解的嵌入技术,在UMAP中用于初始化投影的优化过程。
力导向布局
一种通过模拟点之间的物理力来优化其位置的可视化算法,在UMAP中用于最小化不同空间之间的差异。
随机优化
一种使用随机样本来最小化成本函数的优化方法,被UMAP用于调整低维坐标。
局部结构
原始空间中数据点之间的邻近关系,UMAP保留这些关系以维持数据的自然分组。
全局结构
数据簇和区域之间的大尺度关系,UMAP维持这些关系以保留整个数据集的整体拓扑。
测地距离
一种沿着数据流形曲率测量的距离,UMAP用它来计算内蕴空间中点之间的真实距离。
k近邻
根据定义的度量,给定点的k个最近点的集合,是UMAP中构建邻域图的基础。
交叉熵
一种衡量概率分布之间差异的损失函数,UMAP通过优化它来对齐高维和低维空间。
流形学习
一种发现数据底层流形结构的机器学习范式,UMAP是其现代实现之一。
邻域图
一种表示点之间邻近关系的数据结构,由UMAP构建以模拟数据的局部拓扑。
重心坐标
将一个点表示为参考点加权组合的方法,UMAP用它来进行投影的初始化和插值。
自定义度量
用户定义的用于测量点之间相似性的距离函数,UMAP支持它以使算法适应特定领域。
自适应密度
UMAP根据数据密度动态调整局部分辨率的能力,从而在密集和稀疏区域中都能保留结构。
局部最小值
优化景观中的次优平衡点,UMAP通过先进的初始化和优化技术来避免这些点。
拉普拉斯变换
在UMAP中应用于邻域图的数学算子,用于捕获数据的几何和拓扑属性。
超参数n_neighbors
在UMAP中控制局部邻域大小的参数,影响局部和全局结构保留之间的平衡。
超参数min_dist
在UMAP中正则化聚类紧致性的参数,控制投影空间中点之间的最小距离。