Vision Transformers для обнаружения
Голова Transformer Decoder
Финальный модуль архитектур DETR, преобразующий признаки энкодера в предсказания ограничивающих рамок и классов через внимание на объектных запросах.
← Назад