Vision Transformers (ViT)
Atenção por Janelas Deslocadas
Técnica onde as janelas de atenção são deslocadas entre as camadas para permitir conexões entre janelas, melhorando assim a capacidade do modelo de modelar relações de longa distância.
← Voltar