Nesterov Accelerated Gradient
Warmup Strategy
Technique initialisant progressivement le taux d'apprentissage et le momentum pour stabiliser les premières étapes d'entraînement avec NAG, particulièrement important dans les réseaux profonds.
← Indietro