AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
图像块
将图像分割成规则的网格,由小的正方形部分组成(通常是16x16像素),这些部分被ViT视为序列tokens处理。
个术语
视觉令牌化
将图像分割成离散token序列的过程,这对于将最初为文本设计的transformer架构适应于视觉数据是基础性的。
个术语
DeiT (数据高效图像Transformer)
Vision Transformer的变种,使用蒸馏策略进行训练,以在较少的训练数据下达到竞争性的性能。
个术语
分层视觉Transformers
保持图像多尺度表示的transformer架构,结合了传统CNN的优势和transformers的灵活性。
个术语
层缩放
应用于transformer层中残差的归一化技术,用于稳定训练并改善深度模型的收敛性。
个术语
交叉注意力视觉Transformer
使用不同模态或表示之间交叉注意力机制的架构,允许特征之间更丰富的交互。
个术语
基于窗口的自注意力
注意力限制在局部窗口而非整个图像的变体,减少计算复杂度的同时捕获重要的局部关系。
🔍