Vision Transformers (ViT)
Patch Embedding
Processo de conversão dos patches de imagens em vetores de embeddings de dimensão fixa por projeção linear para alimentar o Transformer.
← VoltarProcesso de conversão dos patches de imagens em vetores de embeddings de dimensão fixa por projeção linear para alimentar o Transformer.
← Voltar