Vision Transformers (ViT)
Class Token
Token especial adicionado à sequência de embeddings cuja representação final após passagem pelo Transformer serve para classificação da imagem.
← VoltarToken especial adicionado à sequência de embeddings cuja representação final após passagem pelo Transformer serve para classificação da imagem.
← Voltar