Architecture Encoder-Decoder
Output Projection
Couche linéaire finale qui projette les représentations du décodeur vers l'espace de vocabulaire, suivie d'un softmax pour produire une distribution de probabilité sur les tokens possibles à chaque position de sortie.
← Retour