Métodos de Taxa de Aprendizagem Adaptativa
AdaDelta
Extensão do AdaGrad que resolve o problema da diminuição monótona da taxa de aprendizado usando uma janela deslizante de gradientes passados em vez da soma cumulativa.
← Voltar