Vision Transformers para Detección
Autoatención Visual
Mecanismo que permite a cada parche de imagen evaluar su importancia relativa con respecto a todos los demás parches para capturar dependencias globales sin convolución.
← Volver