AI 词汇表
人工智能完整词典
多项式回归
多项式回归是一种非线性回归技术,它使用高于一次的多项式函数来模拟变量之间的关系。它能够捕捉复杂的关系,同时在系数方面保持线性框架。
范德蒙矩阵
范德蒙矩阵是在多项式回归中使用的矩阵结构,其中每一列代表自变量的递增幂次。它将非线性问题转换为系数中的线性问题。
多项式次数
多项式次数是决定多项式模型复杂度的参数,对应于方程中的最高指数。高次数增加了灵活性,但存在过拟合的风险。
多项式过拟合
当次数过高的多项式对训练数据过度适应时发生的现象,捕捉噪声而非潜在趋势。它表现为训练时表现优异但泛化能力差。
岭正则化
应用于多项式系数的L2惩罚方法,用于控制系数幅度并防止过拟合。它在成本函数中添加与系数平方成正比的惩罚项。
Lasso正则化
L1惩罚技术,将某些多项式系数强制逼近零,从而实现自动变量选择。它特别有助于消除不相关的多项式项。
交互项
多项式模型中预测变量的乘积,用于捕捉特征之间的协同效应。这些项允许模拟一个变量的效果依赖于另一个变量水平的关系。
K折交叉验证
一种强大的评估技术,将数据分成K个子集,以估计多项式模型在不同分区上的性能。它允许通过最小化验证误差来选择最优次数。
多项式多重共线性
由同一变量派生的多项式项之间的高度相关性,对于高阶多项式尤其成问题。它可能使系数估计不稳定,通常需要进行标准化。
正交多项式
一类多项式(如勒让德多项式、切比雪夫多项式),其项在特定区间内数学上正交。它们能减少多重共线性并提高回归的数值稳定性。
多项式变换
通过将现有变量提升到不同次幂并生成交互项来创建新特征的过程。它变换特征空间以捕捉非线性关系。
多项式学习曲线
显示不同多项式阶数下,训练误差和验证误差随样本量变化的图表。它有助于诊断过拟合或欠拟合。
加权最小二乘法
最小二乘回归的一种变体,其中每个观测值根据其可靠性或方差被赋予一个权重。当多项式数据中存在异方差性时,它特别适用。
多项式特征缩放
在进行多项式变换之前对变量进行标准化或归一化,以避免数值不稳定性。它可以防止多项式不同阶次之间的尺度问题。