Otimização baseada em Momentum
AMSGrad
Modificação do Adam que garante convergência teórica, mantendo o máximo das médias móveis exponenciais ao quadrado para evitar potenciais divergências do Adam.
← Voltar