Vision Transformers
Layer Scaling
Technique de normalisation appliquée aux résidus dans les couches transformer pour stabiliser l'entraînement et améliorer la convergence des modèles profonds.
← Kembali