Vision Transformers
Image Patches
Division d'une image en grilles régulières de petites sections carrées (typiquement 16x16 pixels) qui sont traitées comme des tokens séquentiels par le ViT.
← Indietro