AdaDelta
Normalización del Gradiente
Proceso de escalado de los gradientes utilizando estadísticas históricas para estabilizar el entrenamiento. AdaDelta normaliza los gradientes dividiéndolos por la raíz cuadrada de la media móvil de sus cuadrados.
← Volver