Vision Transformers (ViT)
Atención por Ventanas Desplazadas
Técnica donde las ventanas de atención se desplazan entre capas para permitir conexiones entre ventanas, mejorando así la capacidad del modelo para modelar relaciones de larga distancia.
← Volver