人工智能完整词典
一种层级化的Transformer架构,类似于传统CNN在不同尺度上生成特征图。结合了Transformer的优势和金字塔结构,适用于检测和分割任务。
一种自监督的预训练方法,随机遮盖图像中的补丁块,模型需要重建被遮盖的部分。能够在不需要标注标签的情况下学习丰富的表示。
一种优化技术,在推理过程中动态删除冗余或信息量较少的tokens。在保持模型性能的同时降低计算成本。