Transformer Optimization
Gradient Noise Injection
Technique de régularisation ajoutant du bruit gaussien aux gradients pendant l'entraînement pour améliorer la généralisation et éviter les minima locaux suboptimaux.
← 返回