AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
DBSCAN(基于密度的空间聚类与噪声应用)
一种无监督聚类算法,将密集区域中的点归为一组,并将低密度区域中的孤立点标记为异常或噪声。
个术语
LOF(局部异常因子)
一种异常检测方法,通过测量某点与其邻居的局部密度差异来识别异常点,将密度显著较低的点判定为离群点。
个术语
DBSCAN中的Epsilon(ε)
距离参数,定义某点周围邻域的半径,用于判断该点是否属于高密度区域,对算法的敏感度至关重要。
个术语
DBSCAN中的MinPts
阈值参数,表示在epsilon邻域内所需的最少点数,满足该条件的点被视为核心点。
个术语
核心点(Core Point)
在epsilon半径内至少拥有MinPts个邻居的点,作为DBSCAN中形成密集簇的种子点。
个术语
K距离
某点到其第k个最近邻居的距离,在LOF算法中用作计算局部密度的基础。
个术语
K距离可达距离(Reachability Distance)
LOF中使用的可达距离,定义为邻居的k距离与两点间实际距离的最大值,用于稳定密度测量。
个术语
局部可达密度(Local Reachability Density - LRD)
某点相对于其邻居的平均k距离可达距离的倒数,在LOF算法中量化该点周围的局部密度。
个术语
局部异常因子 (Local Outlier Factor - LOF)
某点的局部可达密度与其邻居平均密度的比值,分数大于1表示该点可能是异常值。
个术语
OPTICS (排序点识别聚类结构)
扩展DBSCAN的密度算法,创建表示密度结构的点序,允许在不同分辨率下提取聚类而无需固定的epsilon参数。
个术语
可达图 (Reachability Graph)
每个点的k距离可达性的可视化表示,由OPTICS生成以识别对应于聚类的密度谷值。
个术语
聚类树压缩 (Cluster Tree Condensation)
HDBSCAN中的过程,通过合并在不同密度尺度上不具有持续性的聚类来简化层次聚类树。
个术语
基于密度的异常分数
定量指标,根据点邻域的密度评估其孤立程度,用于对检测到的异常的严重程度进行排序。
个术语
密度最近邻方法 (Density-Based Nearest Neighbor)
异常检测方法,若某点到其最近邻的距离显著大于其他点的平均距离,则该点被视为异常值。
个术语
基于密度的子采样 (Density-Based Subsampling)
预处理技术,优先保留低密度区域的点来减少数据集大小,提高异常检测的效率。
个术语
孤立森林与密度方法对比
概念区别:孤立森林通过在特征空间中易于孤立来识别异常,而基于密度的方法则通过空间浓度低来识别异常。
🔍