Optimización del Aprendizaje en Línea
AdamW
Modificación de Adam que separa la decaimiento de peso de la actualización adaptativa, mejorando la generalización y la estabilidad en contextos de aprendizaje continuo.
← Volver