Transformadores de Visão
Image Tokenization
Processo de conversão de uma imagem 2D em uma sequência de tokens 1D tratáveis pelos Transformers, envolvendo a segmentação em patches e a projeção linear. Essa tokenização é a etapa crucial que permite adaptar a arquitetura Transformer, inicialmente concebida para texto, ao domínio da visão.
← Voltar