AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
信息增益
一种量化度量,用于衡量根据特定属性对数据集进行划分时所获得的熵减少量,ID3算法使用该指标在每个树节点上选择最优的划分属性。
術語
香农熵
数据集中不确定性或无序程度的数学度量,计算为概率与其二进制对数乘积的负和,作为ID3中计算信息增益的基础。
術語
划分属性
在给定节点上选择的变量,用于将数据集划分为更同质的子集,ID3根据所有可用属性中信息增益最大的原则来选择该属性。
術語
叶节点
ID3决策树的终端节点,不包含任何进一步的划分,代表基于该节点中样本多数类的最终决策或分类。
術語
信息增益率
信息增益的一种变体,通过属性的内在熵进行归一化,旨在纠正ID3算法对具有大量可能值的属性的偏好。
術語
训练集
ID3用于构建决策树的数据子集,包含带标签的样本,使算法能够学习属性与目标类别之间的关系。
術語
类别预测
ID3中的分类过程,新样本从根节点开始沿着树向下遍历直至叶节点,根据连续的属性测试,预测类别即为所到达叶节点关联的类别。
術語
树的深度
在ID3树中,从根节点到任意叶节点所经过的最大分支数,直接影响模型的复杂度及其捕获数据中模式的能力。
術語
纯度标准
衡量节点中类别同质性的指标,其中完全纯净的节点仅包含单一类别的样本,作为ID3中评估划分质量的基础。
術語
解释变量
ID3用于构建决策树的属性集合,每个属性都根据其降低目标变量不确定性的能力来评估其划分潜力。
🔍