Encoder-Decoder Architecture
Hidden Size
Dimensionnalité des vecteurs de représentation interne du transformer, paramètre crucial influençant la capacité du modèle à capturer des caractéristiques complexes et généralement multiple du nombre de têtes d'attention.
← Indietro