Vision Transformers
Self-Attention Baseada em Janelas
Variante de atenção restrita a janelas locais em vez da imagem completa, reduzindo a complexidade computacional enquanto captura relações locais importantes.
← Voltar