Transformadores de Visão (ViT)
Token de Classificação ([CLS])
Token especial adicionado à sequência de patches, cuja representação final é usada para a tarefa de classificação global da imagem, semelhante ao BERT em PNL.
← Voltar