Mini-batch Gradient Descent
Vanilla SGD
Version de base de la descente de gradient stochastique sans mécanismes d'accélération comme le momentum ou l'adaptation du learning rate. Vanilla SGD met à jour les poids en suivant la direction négative du gradient avec un learning rate constant.
← Indietro