Pre-training for Vision
Vision Transformers (ViT)
Architecture neuronale qui applique les transformeurs originellement conçus pour le NLP aux tâches de vision en divisant les images en patches séquentiels.
← 뒤로