Self-Attention Multi-Têtes
Self-Attention Multi-Têtes
Mécanisme d'attention qui exécute en parallèle plusieurs fonctions d'attention pour capturer différentes facettes des relations sémantiques entre tokens. Permet au modèle de se concentrer simultanément sur différentes positions de la séquence d'entrée.
← 뒤로