AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
平衡随机森林
随机森林的一种变体,旨在处理不平衡数据集,通过在平衡的bootstrap子样本上创建决策树,其中每个类别都有相等的代表性。
術語
平衡自助法
一种抽样技术,在每次迭代中抽取bootstrap样本,确保类别的平等代表性,通常通过对多数类进行欠采样或对少数类进行过采样来实现。
術語
多数类欠采样
减少类别不平衡的方法,通过随机移除多数类的观测值来降低其在训练数据集中的主导地位。
術語
少数类过采样
旨在增加少数类观测值数量的技术,通过复制或生成新的合成观测值来平衡类别分布。
術語
Bootstrap样本
从原始数据集中有放回地随机抽取的样本,在bagging方法中用于在每个略有不同的数据子集上训练每个集成模型。
術語
基尼系数
决策树中节点不纯度的度量,量化了如果根据类别分布随机标记,从节点中随机选择的观测值被错误分类的概率。
術語
AUC-ROC(接收者操作特征曲线下面积)
性能度量指标,衡量分类器区分类别的能力,表示真阳性率相对于假阳性率绘制的曲线下面积。
術語
EasyEnsemble
集成学习算法,创建多数类的多个子集,在每个子集与整个少数类组合上训练分类器,并聚合预测结果。
術語
BalanceCascade
一种迭代集成方法,通过在越来越平衡的数据集上顺序训练分类器,并在每个阶段移除被正确分类的多数类样本。
術語
Rappel (Recall ou Sensibilité)
衡量模型正确识别出的真实正例比例的指标,对于评估在少数类上的性能至关重要。
🔍