Optimizador Adam
Decaimiento programado
Estrategia de reducción progresiva de la tasa de aprendizaje en Adam, a menudo utilizada para refinar la convergencia en las últimas fases de entrenamiento al reducir el tamaño de los pasos.
← Volver