Optimización de Transformers
Inyección de Ruido en Gradientes
Técnica de regularización que añade ruido gaussiano a los gradientes durante el entrenamiento para mejorar la generalización y evitar mínimos locales subóptimos.
← Volver