Gradiente Acelerado de Nesterov
Mecanismo Lookahead
Técnica de optimización que mantiene dos conjuntos de pesos: pesos rápidos actualizados frecuentemente y pesos lentos que siguen el promedio de los pesos rápidos para mejorar la generalización.
← Volver