Optimizador Adam
AMSGrad
Modificación de Adam que mantiene el máximo de las estimaciones del segundo momento para garantizar una convergencia teórica, evitando aumentos no monótonos de las tasas de aprendizaje efectivas.
← Volver