Méthodes de Gradient Stochastique
Adagrad
Algorithme d'optimisation adaptatif qui ajuste dynamiquement le taux d'apprentissage pour chaque paramètre en fonction de l'historique des gradients accumulés. Il permet des mises à jour plus grandes pour les paramètres peu fréquents et plus petites pour ceux fréquents.
← Indietro