AI 詞彙表
人工智能完整詞典
精确率 (Precision)
评估模型在所有做出的正类预测中正确预测的比例的指标。它通过最小化假阳性来衡量正类预测的质量。
召回率 (Recall)
衡量模型正确识别数据集中所有真实正类实例能力的指标。召回率通过减少假阴性来量化正类预测的完整性。
F1分数 (F1-Score)
精确率和召回率的调和平均数,在这两个通常相互矛盾的指标之间提供平衡。F1分数对于类别不平衡的情况特别有用,因为单独使用精确率或召回率会产生误导。
F-beta分数 (F-beta Score)
F1分数的泛化,允许根据beta参数对精确率和召回率进行不同加权。该指标适应特定领域需求,可以偏向精确率(beta<1)或召回率(beta>1)。
混淆矩阵 (Confusion Matrix)
列联表,通过比较预测值与真实值来总结分类模型的性能。它将结果分解为真正例、假正例、真反例和假反例,以便进行详细分析。
真正例 (True Positive)
被模型正确分类为正类的实例,代表对目标类别的成功预测。真正例构成召回率的分子,并贡献于精确率的分母。
假正例 (False Positive)
被模型错误预测为正类的负类实例,对应于I类错误。假正例对精确率产生负面影响,但不直接影响正类的召回率。
真反例 (True Negative)
被模型正确识别为负类的实例,展示了其拒绝不相关案例的能力。真反例对于评估模型在多数类上的特异性至关重要。
假阴性 (False Negative)
模型漏检的正例被错误地分类为负例,代表第二类错误。假阴性会直接降低召回率,根据应用领域的不同可能产生严重后果。
平均精度 (Average Precision)
通过计算每个召回率阈值处精度的加权平均值来总结精确率-召回率曲线的指标。特别适用于目标检测系统和信息检索系统的评估。
AUC-PR 分数
精确率-召回率曲线下的面积,衡量模型独立于分类阈值的整体性能。与AUC-ROC不同,AUC-PR对少数类别的性能更为敏感。
灵敏度 (Sensitivity)
召回率的同义词,衡量模型正确识别真实阳性病例的比例。在检测阳性病例优先的医疗应用中,灵敏度至关重要。
特异性 (Specificity)
模型正确识别阴性实例的能力,计算为真阴性数与真实阴性总数的比率。特异性与召回率互补,用于评估所有类别的性能。
平衡准确率 (Balanced Accuracy)
灵敏度和特异性的算术平均值,纠正不平衡数据集中的偏差。该指标公平地处理多数类和少数类的性能。
精确率-召回率曲线
二维图表,绘制不同分类阈值下精确率随召回率变化的曲线。这种可视化有助于分析精确率和召回率之间的权衡,并选择最佳阈值。
杰卡德分数 (Jaccard Score)
衡量两个集合相似度的指标,计算为它们的交集与并集的比率。在分类中,杰卡德分数评估预测阳性实例集合与真实阳性实例集合之间的一致性。
Top-K 精确率
评估模型最自信的前K个预测中正确预测比例的指标。在推荐系统中特别相关,因为只向用户展示排名靠前的建议。
Top-K 召回率
传统召回率的扩展,仅限于模型最可能的前K个预测。该指标衡量系统在仅考虑总预测的一个子集时覆盖相关实例的能力。