AI 词汇表
人工智能完整词典
一对多 (OvR)
一种将多类别分类分解为多个二元分类器的策略,每个分类器区分一个类别与所有其他类别。
一对一 (OvO)
为每对可能的类别训练一个二元分类器的方法,对于n个类别需要n(n-1)/2个分类器。
多类别混淆矩阵
一个NxN的表格,其中N是类别数量,显示模型的正确和错误预测以评估其分类性能。
宏F1分数
每个类别F1分数的未加权平均值,无论类别在数据集中的频率如何,都平等对待所有类别。
微F1分数
通过计算所有类别的真正例、假负例和假正例的总数来全局计算F1分数的指标。
加权F1分数
按类别的F1分数加权平均值,每个类别的贡献与其在数据集中的样本数量成正比。
对数概率
神经网络最后一层在应用softmax函数之前产生的未归一化原始分数,用于多类别分类。
多类别交叉熵
在多类别背景下测量预测概率分布与真实标签分布之间差异的损失函数。
分层抽样
一种抽样技术,保持训练集和测试集中类别的比例,以避免分布偏差。
类别不平衡
数据集中类别表示不均等的情况,可能导致学习偏向多数类。
随机欠采样
一种欠采样方法,随机减少多数类的样本数量以平衡类别分布。
随机过采样
一种过采样方法,随机复制少数类样本以达到与多数类的平衡。
多类别精确率
按类别精确率的平均值计算的指标,其中类别的精确率是真阳性与总阳性预测的比率。
多类别召回率
表示按类别召回率平均值的指标,衡量模型识别每个类别所有相关样本的能力。
多类别ROC曲线
多类别分类的ROC曲线扩展,通常使用一对多或宏平均方法计算。
多类别AUC
多类别问题的ROC曲线下面积,根据一对多方法计算为二元AUC的平均值。
多类决策树
基于规则的算法,递归地划分特征空间,创建对应不同类别的叶节点。
多类逻辑回归
逻辑回归的扩展,使用softmax函数来建模属于K个可能类别中每个类别的概率。
多类支持向量机
适用于多类分类的支持向量机,通常通过一对多或一对一策略实现。
多类K近邻
k近邻算法,根据k个最近邻居中的多数类别对新观测进行分类。
多类朴素贝叶斯
基于贝叶斯定理和条件独立性假设的概率分类器,自然扩展到多类问题。
多类随机森林
集成方法,结合在自举子样本上训练的多个决策树,通过多数投票进行分类。