Vision Transformers para Detección
Detección por Atención Cruzada
Mecanismo bidireccional donde las consultas de objetos interactúan con las características de la imagen para localizar y clasificar objetos simultáneamente.
← Volver