AdaDelta
Normalização do Gradiente
Processo de escalonamento dos gradientes usando estatísticas históricas para estabilizar o treinamento. O AdaDelta normaliza os gradientes dividindo-os pela raiz quadrada da média móvel de seus quadrados.
← Voltar