Adam Optimizer
AMSGrad
Modification d'Adam qui maintient le maximum des estimations du second moment pour garantir une convergence théorique, évitant les augmentations non monotones des taux d'apprentissage effectifs.
← Zurück