Online Learning Optimization
AdaMax
Extension d'Adam utilisant la norme infinie des gradients passés au lieu de la norme L2, offrant une meilleure stabilité numérique dans certains cas extrêmes de données séquentielles.
← Terug