🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

叶子生长

一种树的分裂策略,选择具有最大损失减少的叶子进行分裂,与level-wise生长不同,可以用较少的深度实现更快的收敛。

📖
个术语

特征分箱

将连续特征离散化为离散区间(箱子)的技术,用于加速分裂点的计算并减少内存占用,代价是轻微的精度损失。

📖
个术语

基于梯度的单边采样 (GOSS)

LightGBM的创新采样方法,保留所有具有大梯度的实例,并对小梯度的实例进行随机采样,加速训练而不会显著损失精度。

📖
个术语

互斥特征捆绑 (EFB)

一种降维算法,识别并相互排斥的特征(很少同时非零)组合成一个复合特征,从而减少特征数量。

📖
个术语

梯度直方图

LightGBM使用的数据结构,用于将梯度和二阶导数存储在箱子中,允许在构建树时快速计算每个潜在分裂点的统计信息。

📖
个术语

叶子节点数

LightGBM的主要参数,控制每棵树中叶子节点的最大数量,直接影响模型复杂度和偏差-方差权衡,对于叶子生长比`max_depth`更重要。

📖
个术语

L1和L2正则化

应用于叶子权重的正则化参数(`lambda_l1`, `lambda_l2`),通过分别惩罚高权重和权重幅度来控制模型复杂度并防止过拟合。

📖
个术语

叶子中最少数据量

叶子中所需的最小样本数(或最小总权重),一个关键参数,用于避免创建过于特定的叶子节点并在LightGBM模型中对抗过拟合。

📖
个术语

CatBoost特征处理

LightGBM能够使用特定转换原生处理分类特征,将它们映射为整数,从而避免了手动独热编码,提高了效率。

📖
个术语

叶子优先增长过拟合

叶子优先增长的特定风险,模型可能通过创建非常深且专门的叶子而产生过拟合,需要增加正则化(例如,`num_leaves`、`min_data_in_leaf`)来控制。

📖
个术语

DART(Dropout与多重加性回归树相遇)

LightGBM中实现的增强变体,在添加新树时对先前的树应用dropout技术,在某些数据集上改善正则化和性能。

🔍

未找到结果