AI 詞彙表
人工智能完整詞典
200
類別
2,608
子類別
30,011
術語
術語
图像块
将图像分割成规则的网格,由小的正方形部分组成(通常是16x16像素),这些部分被ViT视为序列tokens处理。
術語
视觉令牌化
将图像分割成离散token序列的过程,这对于将最初为文本设计的transformer架构适应于视觉数据是基础性的。
術語
DeiT (数据高效图像Transformer)
Vision Transformer的变种,使用蒸馏策略进行训练,以在较少的训练数据下达到竞争性的性能。
術語
分层视觉Transformers
保持图像多尺度表示的transformer架构,结合了传统CNN的优势和transformers的灵活性。
術語
层缩放
应用于transformer层中残差的归一化技术,用于稳定训练并改善深度模型的收敛性。
術語
交叉注意力视觉Transformer
使用不同模态或表示之间交叉注意力机制的架构,允许特征之间更丰富的交互。
術語
基于窗口的自注意力
注意力限制在局部窗口而非整个图像的变体,减少计算复杂度的同时捕获重要的局部关系。
🔍