AI 词汇表
人工智能完整词典
前向链验证
一种验证技术,其中每个训练集包含所有先前的观察结果,测试集包含即时的未来数据。仅使用每个时间点之前可用的信息来模拟实时预测。
滚动窗口交叉验证
使用固定大小的窗口在时间上滑动以创建不同训练集和测试集的方法。保持恒定的样本大小,同时保留数据的时间结构。
前向验证
迭代验证方法,模型在历史数据上训练,然后在后续时间段上进行测试,再随时间推进。忠实地再现预测模型部署的实际条件。
扩展窗口交叉验证
训练窗口逐渐扩大以包含所有可用历史数据的技术。特别适用于数据量增加且所有过去的观察结果仍然相关的情况。
时间序列分割
将数据严格按时间顺序划分为训练集和测试集的策略。在scikit-learn中作为TimeSeriesSplit实现,用于评估时间序列模型而不会产生信息泄露。
嵌套时间交叉验证
双重交叉验证,外部验证评估模型性能,而内部验证优化超参数。避免过拟合,同时在所有层面都遵守时间约束。
分块交叉验证
在训练集和测试集之间引入分离块以减少时间相关性的方法。防止时间上接近的数据污染,这种污染可能会使性能评估产生偏差。
时间延迟交叉验证
在训练集和测试集之间插入时间周期以模拟现实预测延迟的方法。当基于预测的决策需要一定执行时间时特别有用。
分层时间交叉验证
将时间交叉验证扩展到具有层次结构的数据,如多层级时间序列。同时满足时间约束和层次数据间的依赖关系。
多时间序列交叉验证
适用于包含多个独立但具有相似特征的时间序列集合的技术。允许在不同序列间泛化,同时保持每个序列的时间顺序。
净化交叉验证
通过从训练集和测试集中移除时间上接近的观测值来减少依赖性的方法。在金融领域至关重要,因为自相关和市场微观结构可能污染结果。
禁期交叉验证
净化交叉验证的变体,在每次测试点后延长排除期。创建时间缓冲区,确保训练和测试阶段完全独立。
自适应时间交叉验证
根据数据特征或模型性能动态调整训练和测试窗口大小的动态方法。优化可用数据的使用,同时适应时间变化。
滑动窗口交叉验证
滚动窗口的具体实现,其中窗口在每次迭代中以固定步长移动。允许精确控制连续训练集和测试集之间的重叠。
时间抽样交叉验证
在时间上定期抽样测试点而非使用连续块的方法。降低计算成本,同时保持不同时间段的公平代表性。