Vision Transformers (ViT)
Patch Embedding
Processus de conversion des patches d'images en vecteurs d'embeddings de dimension fixe par projection linéaire pour alimenter le Transformer.
← ফিরে যান