Layer Normalization
Training Speed
Accélération significative de l'entraînement des transformeurs grâce à la layer normalization, permettant des taux d'apprentissage plus élevés et une convergence plus rapide.
← Retour