Vision Transformers pour Détection
Transformer Decoder Head
Module final des architectures DETR transformant les features encoder en prédictions de boîtes englobantes et classes via attention sur les requêtes d'objets.
← पीछे