AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
Contamination
Isolation Forest 的超参数,定义数据集中预期异常的比例,用于校准异常分数决策阈值。
術語
iTree (Isolation Tree)
在 Isolation Forest 中随机构建的二叉决策树,其中每个分区在随机选择的特征和分割值上进行,直到每个点被隔离。
術語
Isolation
原理认为异常是'数量少且不同'的数据点,因此比正常点更容易隔离,在树中需要更少的分区。
術語
Extension Level
某些 Isolation Forest 实现中的可选超参数,控制每个节点同时分割的维度数量,用于处理非常高维度的数据。
術語
Scoring Function
将平均路径长度转换为标准化异常分数的数学函数,通常基于随机树中路径长度的分布。
術語
Forest Size
Isolation Forest 中构建的 iTree 数量,这是一个影响最终异常分数稳定性和准确性的超参数。
術語
Node Depth
iTree 中特定节点的深度,用于计算路径长度,从而计算数据点的隔离分数。
術語
External Anomalies
位于数据高密度区域之外的异常类型,由于它们能被快速隔离,因此能被 Isolation Forest 有效检测。
術語
计算复杂度
衡量隔离森林的效率,它与观测数量呈线性关系,与特征数量呈次线性关系,使其适用于大型数据集。
🔍