Transformadores de Visión (ViT)
Class Token
Token especial añadido a la secuencia de embeddings cuya representación final después de pasar por el Transformer se utiliza para la clasificación de la imagen.
← Volver