多类分类 - AI 术语表

📖

个术语

一对多 (OvR)

一种将多类别分类分解为多个二元分类器的策略，每个分类器区分一个类别与所有其他类别。

📖

个术语

一对一 (OvO)

为每对可能的类别训练一个二元分类器的方法，对于n个类别需要n(n-1)/2个分类器。

📖

个术语

多类别混淆矩阵

一个NxN的表格，其中N是类别数量，显示模型的正确和错误预测以评估其分类性能。

📖

个术语

宏F1分数

每个类别F1分数的未加权平均值，无论类别在数据集中的频率如何，都平等对待所有类别。

📖

个术语

微F1分数

通过计算所有类别的真正例、假负例和假正例的总数来全局计算F1分数的指标。

📖

个术语

加权F1分数

按类别的F1分数加权平均值，每个类别的贡献与其在数据集中的样本数量成正比。

📖

个术语

对数概率

神经网络最后一层在应用softmax函数之前产生的未归一化原始分数，用于多类别分类。

📖

个术语

多类别交叉熵

在多类别背景下测量预测概率分布与真实标签分布之间差异的损失函数。

📖

个术语

分层抽样

一种抽样技术，保持训练集和测试集中类别的比例，以避免分布偏差。

📖

个术语

类别不平衡

数据集中类别表示不均等的情况，可能导致学习偏向多数类。

📖

个术语

随机欠采样

一种欠采样方法，随机减少多数类的样本数量以平衡类别分布。

📖

个术语

随机过采样

一种过采样方法，随机复制少数类样本以达到与多数类的平衡。

📖

个术语

多类别精确率

按类别精确率的平均值计算的指标，其中类别的精确率是真阳性与总阳性预测的比率。

📖

个术语

多类别召回率

表示按类别召回率平均值的指标，衡量模型识别每个类别所有相关样本的能力。

📖

个术语

多类别ROC曲线

多类别分类的ROC曲线扩展，通常使用一对多或宏平均方法计算。

📖

个术语

多类别AUC

多类别问题的ROC曲线下面积，根据一对多方法计算为二元AUC的平均值。

📖

个术语

多类决策树

基于规则的算法，递归地划分特征空间，创建对应不同类别的叶节点。

📖

个术语

多类逻辑回归

逻辑回归的扩展，使用softmax函数来建模属于K个可能类别中每个类别的概率。

📖

个术语

多类支持向量机

适用于多类分类的支持向量机，通常通过一对多或一对一策略实现。

📖

个术语

多类K近邻

k近邻算法，根据k个最近邻居中的多数类别对新观测进行分类。

📖

个术语

多类朴素贝叶斯

基于贝叶斯定理和条件独立性假设的概率分类器，自然扩展到多类问题。

📖

个术语

多类随机森林

集成方法，结合在自举子样本上训练的多个决策树，通过多数投票进行分类。

AI 词汇表