SAINT

📖

術語

为表格数据专门设计的Transformer类型神经网络架构，集成了样本内和样本间的注意力机制以捕获复杂的依赖关系。

📖

術語

样本内注意力

一种注意力机制，计算表格数据样本内不同特征之间的关系，允许对变量的内在交互进行建模。

📖

術語

样本间注意力

一种注意力机制，评估表格数据集中不同样本（行）之间的关系和相似性，促进全局模式的学习和模型的正则化。

📖

術語

表格Transformer

Transformer架构在表格数据处理中的适应性改造，通常用列的特征替换文本token，并使用针对数据类型的特定编码。

📖

術語

表格位置编码

在表格样本中嵌入特征位置或相对重要性的信息的技术，对于注意力机制区分列至关重要。

📖

術語

注意力正则化

使用样本间注意力权重作为正则化的一种形式，模型基于训练集中的相似样本来学习平滑预测。

📖

術語

查询、键、值投影

应用于特征嵌入的线性变换操作，用于生成注意力计算中使用的查询（Query）、键（Key）和值（Value）张量。

📖

術語

表格注意力得分

衡量一个特征相对于另一个特征的重要性或相关性的度量，计算为查询向量和键向量之间的点积，后接softmax函数。

📖

術語

注意力聚合

通过注意力分数确定权重，对多个特征或样本的信息进行加权组合的过程，以产生丰富的上下文表示。

📖

術語

Transformer层归一化

应用于Transformer中每个子层（注意力或前馈网络）输出的归一化技术，稳定训练并改善模型收敛。

📖

術語

位置前馈网络

独立应用于每个特征表示的全连接模块，使模型能够在注意力机制后学习复杂的非线性变换。

📖

術語

学习的分类编码

将分类变量转换为嵌入向量，其值在训练期间优化的方法，不同于独热编码等静态方法。

📖

術語

高阶特征交互

SAINT模型自动捕获两个以上特征之间复杂非线性关系的能力，无需手动特征工程。

📖

術語

表格数据的线性可分性

对于复杂表格数据通常是无效的假设，证明了使用像SAINT这样非线性模型的合理性，这些模型可以学习更灵活的决策边界。

📖

術語

表格数据中的结构噪声

表格数据集中固有的异常值或不一致性的存在，SAINT的注意力机制可以通过关注最相关的特征来减轻这些影响。

AI 詞彙表