Vision Transformers
Token Learner
Module dynamique qui apprend à sélectionner et combiner les tokens les plus pertinents de l'image, réduisant la complexité computationnelle tout en préservant les informations essentielles.
← Retour