AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
真阳性 (TP)
正确的结果,模型正确地将实际为正值的观察预测为正值,表明对目标类别的成功分类。真阳性的数量对于评估模型正确识别相关情况的能力至关重要。
个术语
假阳性 (FP)
分类错误,模型错误地将实际为负值的观察预测为正值,对应于误报。在医疗诊断或欺诈检测等领域,假阳性特别昂贵。
个术语
精确率 (Precision)
计算为真阳性与真阳性和假阳性之和的比率,衡量所有正预测中正确正预测的比例。当假阳性的成本很高时,这一指标特别重要。
个术语
召回率 (Recall)
也称为灵敏度,衡量真阳性与真阳性和假阴性之和的比率,评估模型识别所有实际正值观察的能力。当假阴性具有严重后果时,召回率至关重要。
个术语
ROC曲线
图表表示真阳性率与假阳性率在不同分类阈值下的关系,说明灵敏度与特异性之间的权衡。该曲线下面积(AUC)量化了分类器的整体性能。
个术语
逻辑回归
广义线性模型,使用sigmoid函数将连续预测映射到二分类中0到1之间的概率。这种可解释的模型通常用作二分类问题的基准。
个术语
决策阈值
阈值(通常为0.5),用于将输出概率转换为二元预测,高于该值的观察被分类为正值。调整此阈值可以优化精确率和召回率之间的权衡。
个术语
类别不平衡
情况是,在训练数据集中,一个类别比另一个类别的代表性明显更强,可能使模型偏向多数类别。这个问题需要特定的技术,如过采样或类别权重。
个术语
SMOTE
合成少数类过采样技术,通过在现有实例之间进行插值生成新的少数类样本,从而在没有精确重复的情况下平衡类别分布。SMOTE在提高不平衡数据集上的性能方面特别有效。
个术语
Arbre de Décision Binaire
使用二元决策的分层结构将特征空间划分为纯净区域的分类算法,每个叶子代表一个预测类别。决策树提供了很高的可解释性,但容易过拟合。
个术语
Spécificité
计算为真阴性数除以真阴性和假阳性数之和的度量,评估模型正确识别负观测值的能力。特异性与召回率互补,在筛查测试中至关重要。
🔍