SAINT
Normalización de Capa Transformer
Técnica de normalización aplicada a la salida de cada subcapa (atención o red feed-forward) en un Transformer, estabilizando el entrenamiento y mejorando la convergencia del modelo.
← Volver