Attention Additive
Matrice de Poids d'Attention
Structure bidimensionnelle stockant les poids d'attention calculés entre chaque position de la séquence cible et toutes les positions de la séquence source.
← Terug