Adam Optimizer
AMSGrad
Modificação do Adam que mantém o máximo das estimativas do segundo momento para garantir uma convergência teórica, evitando aumentos não-monotônicos das taxas de aprendizagem efetivas.
← Voltar