Optimización del Aprendizaje en Línea
Mini-batch SGD
Compromiso entre SGD y gradiente por lotes, utilizando pequeños subconjuntos de datos para estimar los gradientes, ofreciendo un mejor equilibrio entre velocidad de convergencia y estabilidad numérica.
← Volver