二元分类 - AI 术语表

📖

个术语

真阳性 (TP)

正确的结果，模型正确地将实际为正值的观察预测为正值，表明对目标类别的成功分类。真阳性的数量对于评估模型正确识别相关情况的能力至关重要。

📖

个术语

假阳性 (FP)

分类错误，模型错误地将实际为负值的观察预测为正值，对应于误报。在医疗诊断或欺诈检测等领域，假阳性特别昂贵。

📖

个术语

精确率 (Precision)

计算为真阳性与真阳性和假阳性之和的比率，衡量所有正预测中正确正预测的比例。当假阳性的成本很高时，这一指标特别重要。

📖

个术语

召回率 (Recall)

也称为灵敏度，衡量真阳性与真阳性和假阴性之和的比率，评估模型识别所有实际正值观察的能力。当假阴性具有严重后果时，召回率至关重要。

📖

个术语

ROC曲线

图表表示真阳性率与假阳性率在不同分类阈值下的关系，说明灵敏度与特异性之间的权衡。该曲线下面积（AUC）量化了分类器的整体性能。

📖

个术语

逻辑回归

广义线性模型，使用sigmoid函数将连续预测映射到二分类中0到1之间的概率。这种可解释的模型通常用作二分类问题的基准。

📖

个术语

决策阈值

阈值（通常为0.5），用于将输出概率转换为二元预测，高于该值的观察被分类为正值。调整此阈值可以优化精确率和召回率之间的权衡。

📖

个术语

类别不平衡

情况是，在训练数据集中，一个类别比另一个类别的代表性明显更强，可能使模型偏向多数类别。这个问题需要特定的技术，如过采样或类别权重。

📖

个术语

SMOTE

合成少数类过采样技术，通过在现有实例之间进行插值生成新的少数类样本，从而在没有精确重复的情况下平衡类别分布。SMOTE在提高不平衡数据集上的性能方面特别有效。

📖

个术语

Arbre de Décision Binaire

使用二元决策的分层结构将特征空间划分为纯净区域的分类算法，每个叶子代表一个预测类别。决策树提供了很高的可解释性，但容易过拟合。

📖

个术语

Spécificité

计算为真阴性数除以真阴性和假阳性数之和的度量，评估模型正确识别负观测值的能力。特异性与召回率互补，在筛查测试中至关重要。

AI 词汇表