Transformers de Visão
Token Learner
Módulo dinâmico que aprende a selecionar e combinar os tokens mais relevantes da imagem, reduzindo a complexidade computacional enquanto preserva as informações essenciais.
← Voltar