Atención Dispersa
Kernelized Attention
Méthode approximant l'attention par des opérations de convolution utilisant des noyaux de feature maps, évitant le calcul explicite de la matrice d'attention.
← Volver