Transformadores de Visão (ViT)
Autoatenção em Janelas
Mecanismo de atenção onde os cálculos são restritos a janelas locais de patches, reduzindo a complexidade quadrática do MHSA padrão para imagens de alta resolução.
← Voltar