AdaDelta
Unidades Consistentes
Princípio fundamental do AdaDelta onde as atualizações têm as mesmas unidades que os parâmetros, eliminando a necessidade de uma taxa de aprendizado global. Esta abordagem utiliza a razão entre as médias móveis das atualizações passadas e dos gradientes atuais.
← Voltar