AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
分箱
将连续值分组为离散类别(箱)的预处理技术,用于简化数据并捕获非线性关系。
術語
离散化
通过划分值空间将连续定量变量转换为有序定性变量的数学过程。
術語
等宽分箱
将数据范围划分为固定宽度区间的离散化方法,简单但对异常值敏感。
術語
分位数分箱
创建包含相等数量观测值的箱的方法,确保均匀分布但可能合并不同的值。
術語
有监督分箱
利用目标变量信息优化区间创建的方法,以最大化类别间的分离度。
術語
无监督分箱
仅基于预测变量分布而不考虑目标变量的离散化方法。
術語
K均值分箱
应用K均值算法识别数据自然中心,并基于到这些中心的距离创建箱的技术。
術語
决策树分箱
使用决策树识别最优切分点的方法,以最大化每个箱内的同质性。
術語
熵分箱
基于熵最小化的方法,创建能够最大化每个离散区间内信息量的分箱。
術語
卡方分箱
使用卡方检验的统计方法,迭代评估并合并最不显著的相邻区间。
術語
等频分箱
创建具有近似相等观测数量的分箱技术,不考虑数值区间的宽度。
術語
最优分箱
通过最大化质量度量(如信息价值IV)来确定最优分割点的优化算法。
術語
单调分箱
确保分箱与目标变量之间具有单调关系的离散化约束,在信用评分中至关重要。
術語
加权分箱
考虑每个观测值相关权重的分箱变体,基于加权质量创建区间。
術語
时间分箱
针对时间序列的专门技术,基于时间段或季节模式创建分箱。
術語
多维分箱
同时考虑多个变量在N维空间中创建超立方体的分箱扩展方法。
術語
增量分箱
一种自适应方法,当新数据到达时动态更新分箱,无需完全重新计算。
術語
等频分箱
分位数分箱的同义词,确保在所有创建的分箱中观测值均匀分布。
術語
证据权重分箱
信用风险领域的专门技术,将分箱转换为WOE评分,以捕捉每个分箱的相对预测能力。
🔍