Métodos de Taxa de Aprendizagem Adaptativa
AdaGrad
Algoritmo de otimização que adapta a taxa de aprendizado de cada parâmetro com base na soma histórica dos quadrados dos gradientes, permitindo atualizações maiores para parâmetros pouco frequentes.
← Voltar