Transformadores de Visión (ViT)
Token de Clasificación ([CLS])
Token especial añadido a la secuencia de parches, cuya representación final se utiliza para la tarea de clasificación global de la imagen, similar al BERT en PLN.
← Volver