Transformadores de Visión
Auto-atención Basada en Ventanas
Variante de atención restringida a ventanas locales en lugar de la imagen completa, reduciendo la complejidad computacional mientras captura las relaciones locales importantes.
← Volver