AI 詞彙表
人工智能完整詞典
DBSCAN
基于密度的聚类算法,将足够接近的点分组在一起,同时将低密度区域中的孤立点标记为异常值。
Epsilon (ε)
定义点周围邻域半径的参数,用于确定点是否属于聚类,直接影响聚类的粒度。
MinPts
阈值参数,定义ε邻域中所需的最少点数,以使一个点被认为是核心点。
Point Core
聚类的中心点,在其ε邻域中至少有MinPts个点,作为形成密集簇的锚点。
Point Border
位于聚类外围的点,没有足够的邻居成为核心点,但可以从核心点到达。
Point Noise
不属于任何聚类的点,因为它既不是核心点,也不是从核心点可达的,通常被视为异常。
Voisinage ε
距离给定点小于或等于ε的所有点的集合,构成DBSCAN中密度计算的基础。
Densité-directement atteignable
一种关系,其中如果点q位于核心点p的ε邻域内,则q可以从p直接访问。
密度可达
一种传递关系,其中一个点可以通过一系列密度直接可达的点从核心点到达。
密度连通
一种对称关系,如果存在一个共同的核心点,两个点都可以从该核心点密度可达,则这两个点是连通的。
OPTICS
扩展DBSCAN的算法,它产生一个基于密度的聚类顺序,允许提取不同密度的簇。
HDBSCAN
DBSCAN的层次化变体,它构建一个不同密度簇的层次结构,并自动选择稳定的簇。
R树索引
空间索引数据结构,优化了ε半径内的邻居搜索,显著加速了大型数据集上的DBSCAN。
维度诅咒
在高维空间中,距离度量失去其意义的现象,影响了基于密度算法的性能。
轮廓系数
衡量簇内聚性和簇间分离性的评估指标,用于优化ε和MinPts参数。
任意形状的簇
DBSCAN的主要优势,能够检测非凸和复杂形状的簇,不像K-means等算法。
异常检测
DBSCAN的自然应用,其中被识别为噪声的点对应数据中的异常值或离群值。
空间分区
将数据空间划分为基于密度的区域的过程,这是DBSCAN和类似算法运作的基础。
邻域图
一种图形表示,其中节点是点,边连接ε邻域内的点,用于可视化密度结构。
可达距离
OPTICS和HDBSCAN中使用的修改距离,考虑局部密度以根据可达性对点进行排序。
核心距离
一个点成为核心点所需的最小距离,计算为到第MinPts个最近邻的距离。