人工智能完整词典
一种允许每个图像块相对于所有其他图像块评估其相对重要性,从而无需卷积即可捕获全局依赖关系的机制。
一种双向机制,其中对象查询与图像特征进行交互,以同时定位和分类对象。
一种通过重塑和重组引入Token之间渐进式过渡的变体,旨在保留局部结构信息。
DETR 架构的最终模块,通过对对象查询的注意力,将编码器特征转换为边界框和类别的预测。