AdaDelta
Unidades Consistentes
Principio fundamental de AdaDelta donde las actualizaciones tienen las mismas unidades que los parámetros, eliminando la necesidad de una tasa de aprendizaje global. Este enfoque utiliza la relación entre las medias móviles de las actualizaciones pasadas y los gradientes actuales.
← Volver