AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
决策树
一种监督预测模型,使用树状结构通过一系列数据特征测试来模拟决策及其可能后果。
个术语
根节点
决策树的起点,代表完整的训练数据集,包含基于最具区分性特征的第一次划分。
个术语
内部节点
决策树中的中间节点,表示对特定特征的测试,并将数据分割成同质子集。
个术语
叶子节点
决策树的终端节点,代表最终决策或类别预测,无法进一步划分。
个术语
分割准则
用于评估决策树中划分质量的定量方法,旨在最大化结果子集的同质性。
个术语
熵
数据集中无序性或不确定性的数学度量,用于量化决策树中节点的不纯度。
个术语
信息增益
通过根据特定特征划分节点获得的熵减少量的度量,用于选择最佳划分。
个术语
基尼指数
取值在0到1之间的不纯度度量,计算随机选择元素被错误分类的概率,是决策树中熵的替代方案。
个术语
剪枝
一种通过移除对预测能力贡献较小的分支来降低决策树复杂度的技术,以避免过拟合。
个术语
过拟合
指模型过度学习训练数据中的细节和噪声,从而损害其在新数据上泛化能力的现象。
个术语
树的深度
从根节点到叶节点的最大分裂次数,是控制模型复杂度和偏差的关键参数。
个术语
CART
分类与回归树算法,它使用基尼指数作为分类的分裂标准来构建二叉树。
个术语
ID3
一种使用信息增益作为分裂标准的早期决策树算法,仅限于分类变量和二元分裂。
个术语
C4.5
对ID3算法的改进,它使用信息增益率来避免对具有大量值的特征产生偏向。
个术语
目标变量
在监督学习问题中需要预测的变量,由决策树的终端叶节点表示。
个术语
决策规则
从决策树中的路径提取的一组IF-THEN逻辑条件,用于解释和说明模型的预测结果。
个术语
变量重要性
对每个预测特征在提升树中所有划分的纯度方面的贡献的定量度量。
个术语
复杂度成本
一种剪枝参数,用于惩罚树的大小,以平衡数据拟合和模型简洁性,从而优化泛化能力。
🔍