Vision Transformers
Window-based Self-Attention
Variante d'attention restreinte à des fenêtres locales而非 l'image complète, réduisant la complexité computationnelle tout en capturant les relations locales importantes.
← Zurück