Transformers de Visão para Detecção
ViT Token-to-Token
Variante que introduz uma transição progressiva entre tokens com redimensionamento e recombinação para preservar informações estruturais locais.
← Voltar