AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
Contamination
Isolation Forest 的超参数,定义数据集中预期异常的比例,用于校准异常分数决策阈值。
个术语
iTree (Isolation Tree)
在 Isolation Forest 中随机构建的二叉决策树,其中每个分区在随机选择的特征和分割值上进行,直到每个点被隔离。
个术语
Isolation
原理认为异常是'数量少且不同'的数据点,因此比正常点更容易隔离,在树中需要更少的分区。
个术语
Extension Level
某些 Isolation Forest 实现中的可选超参数,控制每个节点同时分割的维度数量,用于处理非常高维度的数据。
个术语
Scoring Function
将平均路径长度转换为标准化异常分数的数学函数,通常基于随机树中路径长度的分布。
个术语
Forest Size
Isolation Forest 中构建的 iTree 数量,这是一个影响最终异常分数稳定性和准确性的超参数。
个术语
Node Depth
iTree 中特定节点的深度,用于计算路径长度,从而计算数据点的隔离分数。
个术语
External Anomalies
位于数据高密度区域之外的异常类型,由于它们能被快速隔离,因此能被 Isolation Forest 有效检测。
个术语
计算复杂度
衡量隔离森林的效率,它与观测数量呈线性关系,与特征数量呈次线性关系,使其适用于大型数据集。
🔍