Normalización de Capa
Epsilon de LayerNorm
Parámetro de estabilidad numérica añadido en la normalización de capa para evitar la división por cero al calcular la varianza de las activaciones.
← Volver