Vision Transformers (ViT)
DeiT (Data-efficient Image Transformer)
Variante du ViT entraînable avec des quantités de données plus modestes grâce à une stratégie de distillation de connaissances où un token de distillation est ajouté pour apprendre d'un professeur CNN.
← पीछे