Transformadores de visión
Características invariantes a la escala
Características extraídas por los Vision Transformers que permanecen robustas ante los cambios de escala de los objetos en las imágenes. Estas propiedades emergen naturalmente de la arquitectura global de los Transformers gracias a su capacidad para modelar relaciones a larga distancia entre parches.
← Volver