AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
CF树(聚类特征树)
BIRCH的核心树形数据结构,在其节点中存储统计摘要(聚类特征),以紧凑地表示子簇。
个术语
聚类特征(CF)
一个三元组(N, LS, SS),统计地概括了一个子簇,其中N是点的数量,LS是点的线性总和,SS是点的平方和。
个术语
直径阈值(阈值)
BIRCH参数,定义了CF树叶子节点中子簇的最大直径,控制聚类摘要的粒度。
个术语
分支因子(分支因子)
限制CF树中每个节点的条目(子节点)数量的参数,影响树的大小和形状以优化性能。
个术语
微聚类
BIRCH的初始阶段,其中数据点被组织成微簇,由CF树的叶子节点条目表示。
个术语
宏聚类
BIRCH的最终阶段,在微簇(CF树的叶子节点)上应用聚类算法(如K-Means)以生成最终的簇。
个术语
增量式摘要
BIRCH能够用新的数据点更新CF树而不需要从头开始完全重新计算的能力,非常适合数据流。
个术语
CF加性距离(聚类特征加性距离)
BIRCH中使用的距离度量,用于测量两个聚类特征之间的接近度,可以直接从它们的统计摘要计算出来,而无需访问原始点。
个术语
叶子条目 (Leaf Entry)
CF树中叶子的元素,代表一个微簇,包含一个聚类特征和指向叶子链表中下一个节点的指针。
个术语
叶子链表 (Leaf Linked List)
CF树中连接所有叶子的结构,用于在宏聚类阶段进行高效的顺序扫描。
个术语
点吸收 (Point Absorption)
BIRCH中的一个过程,如果添加不会超过直径阈值,新数据点将被集成到最近的微簇中。
个术语
节点分裂 (Node Splitting)
BIRCH中触发的机制,当插入一个点会导致超过直径阈值或分支因子时,分裂节点以保持约束。
个术语
重建阶段 (Rebuilding Phase)
BIRCH中的可选步骤,在最终阶段之前使用更低的直径阈值重建CF树,以提高聚类精度。
个术语
增量计算成本
BIRCH的关键优势,插入数据点的成本与点数成对数关系,使算法具有很高的可扩展性。
个术语
聚类摘要 (Cluster Summary)
BIRCH的基本概念,其中一组点由统计摘要(CF)而不是各个点表示,减少内存使用。
🔍